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Prefácio 


“Vemos que a teoria da probabilidade é no fundo somente o senso comum 
reduzido ao cálculo; ela nos faz apreciar com exatidão o que mentes pensantes 
percebem como que por instinto, muitas vezes sem se dar conta disso. (...) É 
extraordinário que esta ciência, que surgiu da análise dos jogos de azar, tenha 
se tornado o mais importante objeto do conhecimento humano. (...) As mais 
importantes questões da vida são na verdade, em sua grande maioria, apenas 
problemas de probabilidade.” Assim disse o famoso matemático e astrônomo 
francês Pierre-Simon, Marquês de Laplace (“o Newton francês”). Embora mui- 
tas pessoas pensem que o famoso marquês, que também foi um dos que mais 
contribuiu para o desenvolvimento da probabilidade, possa ter exagerado um 
pouco, é no entanto verdade que a teoria da probabilidade se tornou uma ferra- 
menta de importância fundamental para praticamente todos os pesquisadores, 
engenheiros, médicos, juristas e empresários. De fato, um indivíduo instruído 
em probabilidade aprende a não perguntar “É assim mesmo?” mas, em vez 
disso, “Qual é a probabilidade de ser assim?” 

O propósito deste livro é servir como uma introdução elementar à teoria 
da probabilidade para estudantes dos cursos de matemática, estatística, enge- 
nharia e ciências (incluindo ciência da computação, biologia, ciências sociais 
e administração) que já tenham cursado uma disciplina de cálculo básico. Ele 
tenta apresentar não somente a matemática da teoria da probabilidade, mas 
também, por meio de numerosos exemplos, as muitas aplicações possíveis deste 
assunto. 

O Capítulo 1 apresenta os princípios básicos da análise combinatória, que 
são muito úteis no cálculo de probabilidades. 

O Capítulo 2 lida com os axiomas da teoria da probabilidade e mostra como 
eles podem ser aplicados no cálculo de várias probabilidades de interesse. 

O Capítulo 3 lida com os assuntos extremamente importantes da probabi- 
lidade condicional e da independência de eventos. Por meio de uma série de 
exemplos, ilustramos como as probabilidades condicionais entram em jogo não 
somente quando dispomos de alguma informação parcial; quando não dispo- 
mos de tal informação, as probabilidades condicionais funcionam como uma 
ferramenta que nos permite calcular probabilidades mais facilmente. Essa téc- 
nica extremamente importante reaparece no Capítulo 7 no qual a utilizamos 
para obter esperanças. 

O conceito de variáveis aleatórias é introduzido nos Capítulos 4, 5 e 6. Va- 
riáveis aleatórias discretas são discutidas no Capítulo 4, variáveis aleatórias 
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contínuas no Capítulo 5 e variáveis aleatórias conjuntamente distribuídas no 
Capítulo 6. Os importantes conceitos de valor esperado e variância de uma 
variável aleatória são introduzidos nos Capítulos 4 e 5, e essas grandezas são 
então determinadas para muitos dos tipos comuns de variáveis aleatórias. 

Propriedades adicionais do valor esperado são consideradas no Capítulo 1. 
Muitos exemplos ilustrando a utilidade do resultado de que o valor esperado 
de uma soma de variáveis aleatórias é igual à soma de seus valores esperados 
são apresentados. Seções referentes à esperança condicional, incluindo o seu 
uso em predições e funções geratrizes de momentos, estão contidas neste ca- 
pítulo. Além disso, a seção final introduz a distribuição normal multivariada e 
apresenta uma demonstração simples relativa à distribuição conjunta da média 
e da variância amostrais de uma amostra de uma distribuição normal. 

O Capítulo 8 apresenta os mais importantes resultados teóricos da teoria 
da probabilidade. Em particular, demonstramos a lei forte dos grandes números 
e o teorema do limite central. Nossa demonstração da lei forte dos grandes nú- 
meros é relativamente simples; ela supõe que as variáveis possuam um quarto 
momento finito. Nossa prova do teorema do limite central faz uso do teorema 
da continuidade de Levy. Esse capítulo também apresenta as desigualdades de 
Markov e Chebyshevy, e os limites de Chernoff. A seção final do Capítulo 8 for- 
nece um limite para o erro envolvido quando a probabilidade da soma de variá- 
veis aleatórias de Bernoulli independentes é aproximada pela probabilidade de 
uma variável aleatória de Poisson com o mesmo valor esperado. 

O Capítulo 9 apresenta alguns tópicos adicionais, como as cadeias de Ma- 
rkov, o processo de Poisson, e uma introdução à teoria da informação e da co- 
dificação. O Capítulo 10 trata de simulação. 

Como na edição anterior, três conjuntos de exercícios são fornecidos no 
final de cada capítulo. Eles são chamados de Problemas, Exercícios Teóricos e 
Problemas de Autoteste e Exercícios. Este último conjunto de exercícios, cujas 
soluções completas aparecem nas Soluções para os Problemas de Autoteste e 
Exercícios, foi elaborado para ajudar os estudantes a testarem a sua compreen- 
são e estudarem para as provas. 


MUDANÇAS NA NOVA EDIÇÃO 


A oitava edição continua a evolução e o ajuste do texto. Ela inclui novos pro- 
blemas, exercícios e material teórico escolhidos por seu interesse inerente e 
por seu papel na consolidação da intuição do estudante em probabilidade. Ilus- 
trações desses objetivos podem ser encontradas no Exemplo 5d do Capítulo 
1, que trata de torneios mata-mata, e nos Exemplos 4k e Si do Capítulo 7, que 
tratam do problema da ruína do jogador. 

Uma mudança fundamental na edição atual traduz-se na apresentação, no 
Capítulo 4 (em vez do Capítulo 7, como ocorria nas edições anteriores), do im- 
portante resultado de que a esperança de uma soma de variáveis aleatórias é 
igual à soma das esperanças. Uma nova € elementar demonstração desse re- 
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sultado é fornecida nesse capítulo para o caso particular de um experimento 
probabilístico com espaço amostral finito. 

Outra mudança é a expansão da Seção 6.3, que trata da soma de variáveis 
aleatórias independentes. A Seção 6.3.1 é uma nova seção na qual deduzimos a 
distribuição da soma de variáveis aleatórias uniformes independentes e identi- 
camente distribuídas e depois usamos os resultado obtidos para mostrar que o 
número esperado de números aleatórios que precisam ser somados para que a 
sua soma exceda 1 é igual a e. A Seção 6.3.5 é uma nova seção na qual deduzi- 
mos a distribuição de uma soma de variáveis aleatórias geométricas indepen- 
dentes com médias diferentes. 
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1.1 INTRODUÇÃO 


Eis um típico problema envolvendo probabilidades: um sistema de comunicação 
formado por n antenas aparentemente idênticas que devem ser alinhadas em 
sequência. O sistema resultante será capaz de receber qualquer sinal — e será 
chamado de funcional — desde que duas antenas consecutivas não apresentem 
defeito. Se exatamente m das n antenas apresentarem defeito, qual será a proba- 
bilidade de que o sistema resultante seja funcional? Por exemplo, no caso espe- 
cial onde n = 4em = 2, há seis configurações possíveis para o sistema, a saber, 


0110 


AO HO 
oOoSOOm 
SonhHOoO 
SonHnonm 


onde 1 significa que a antena funciona e 0, que ela está com defeito. Como o 
sistema funciona nos três primeiros arranjos e não funciona nos três arranjos 
restantes, parece razoável tomar 3/6 = 1/2 como a probabilidade desejada. No 
caso de n e m quaisquer, poderíamos calcular, de forma similar, a probabilidade 
de que o sistema funcione. Isto é, poderíamos contar o número de configura- 
ções que resultam no funcionamento do sistema e dividir esse número pelo 
número total de configurações possíveis. 

Da discussão anterior, percebemos que seria útil possuir um método efi- 
caz para contar o número de maneiras pelas quais as coisas podem ocorrer. 


16 Probabilidade: Um Curso Moderno com Aplicações 


De fato, muitos problemas na teoria da probabilidade podem ser resolvidos 
simplesmente contando-se o número de diferentes maneiras pelas quais certo 
evento pode ocorrer. A teoria matemática da contagem é formalmente conhe- 
cida como análise combinatória. 


1.2 O PRINCÍPIO BÁSICO DA CONTAGEM 


O princípio básico da contagem será fundamental para todo nosso trabalho. 
Dito de forma simples, ele diz que se um experimento pode levar a qualquer 
um de m possíveis resultados e se outro experimento pode resultar em qual- 
quer um de n possíveis resultados, então os dois experimentos possuem mn 
resultados possíveis. 


O princípio básico da contagem 


Suponha a realização de dois experimentos. Se o experimento 1 pode gerar 


qualquer um de m resultados possíveis e se, para cada um dos resultados do ex- 
perimento 1, houver n resultados possíveis para o experimento 2, então os dois 
experimentos possuem conjuntamente mn diferentes resultados possíveis. 


Demonstração do princípio básico: O princípio básico pode ser demonstrado ao 
serem enumerados todos os possíveis resultados dos dois experimentos; isto é, 


1,0), 4,2, ..., 1,n) 
2,1, 2,2), ..., (2,n) 


(m, D, (m,2), ..., (mn) 


onde dizemos que o resultado é (i,j) se o experimento 1 levar ao seu i-ésimo 
resultado possível e o experimento 2 levar ao seu j-ésimo resultado possível. 
Portanto, o conjunto dos resultados possíveis consiste de m linhas, cada uma 
contendo n elementos. Isso demonstra o resultado. 


Exemplo 2a 


Uma pequena comunidade é composta por 10 mulheres, cada uma com 3 filhos. 
Se uma mulher e um de seus filhos devem ser escolhidos como mãe e filho do 
ano, quantas escolhas diferentes são possíveis? 


Solução Supondo a escolha da mulher como o resultado do primeiro expe- 
rimento, e a subsequente escolha de um de seus filhos como o resultado do 
segundo experimento, vemos a partir do princípio básico que há 10 x 3 = 30 
escolhas possíveis. D 


Quando há mais que dois experimentos a serem realizados, pode-se gene- 
ralizar o princípio básico. 
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Generalização do princípio básico da contagem 


Se r experimentos são tais que o primeiro experimento pode levar a qual- 
quer um de n, resultados possíveis; e se, para cada um desses n, resultados 
houver n, resultados possíveis para o segundo experimento; e se, para 
cada um dos possíveis resultados dos dois primeiros experimentos houver 
n, resultados possíveis para o terceiro experimento; e se..., então haverá 
um total de n, :n, : : :n, resultados possíveis para os r experimentos. 


Exemplo 2b 


O grêmio de uma faculdade é formado por 3 calouros, 4 estudantes do segundo 
ano, 5 estudantes do terceiro ano e 2 formandos. Um subcomitê de 4 pessoas, 
formado por uma pessoa de cada ano, deve ser escolhido. Quantos subcomitês 
diferentes são possíveis? 


Solução Podemos vislumbrar a escolha de um subcomitê como o resultado com- 
binado dos quatro experimentos separados de escolha de um único representante 
de cada uma das classes. Daí segue, a partir da versão generalizada do princípio 
básico, que há 3 x 4 X 5 x 2 = 120 subcomitês possíveis. E 


Exemplo 2c 
Quantas diferentes placas de automóvel com 7 caracteres são possíveis se os três 
primeiros campos forem ocupados por letras e os 4 campos finais por números? 


Solução Pela versão generalizada do princípio básico, a resposta é 26 - 26 - 26 - 
10-10 - 10-10 = 175.760.000. E 


Exemplo 2d 
Quantas funções definidas em n pontos são possíveis se cada valor da função 
for iguala O ou 1? 


Solução Suponha que os pontos sejam 1, 2,..., n. Como f(i) deve ser igual a O 
ou 1 para cada i = 1,2,...,n, tem-se 2” funções possíveis. nm 


Exemplo 2e 


No Exemplo 2c, quantas placas de automóvel seriam possíveis se a repetição 
entre letras ou números fosse proibida? 


Solução Neste caso, seriam 26 ê 25:24:10-9-8:7 = 78.624.000 placas de 
automóvel possíveis. = 


1.3 PERMUTAÇÕES 


Quantos diferentes arranjos ordenados das letras a, b e c são possíveis? Por 
enumeração direta vemos que são 6, ou seja, abc, acb, bac, bca, cab e cba. Cada 
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combinação é conhecida como uma permutação. Assim, vê-se que um conjunto 
de 3 objetos permite 6 permutações possíveis. Esse resultado poderia ser obtido 
a partir do princípio básico, já que o primeiro objeto da permutação pode ser 
qualquer um dos três, o segundo objeto da permutação pode então ser escolhido 
a partir dos dois restantes e o terceiro objeto da permutação é o objeto restante. 
Assim, há 3-2 - 1 = 6 permutações possíveis. 

Suponha agora que tenhamos n objetos. O emprego de um raciocínio si- 
milar àquele que acabamos de utilizar no caso das três letras mostra então 
que há 


n(n-D)(n-2)--3:2:1=0! 


permutações diferentes dos n objetos. 


Exemplo 3a 


Quantas diferentes ordens de rebatedores são possíveis em um time de beise- 
bol formado por 9 jogadores? 


Solução Há 9! = 362.880 ordens de rebatedores possíveis. o 


Exemplo 3b 


Uma turma de teoria da probabilidade é formada por 6 homens e 4 mulheres. 
Aplica-se uma prova e os estudantes são classificados de acordo com o seu desem- 
penho. Suponha que nenhum dos estudantes tenha tirado a mesma nota. 


(a) Quantas diferentes classificações são possíveis? 
(b) Se os homens forem classificados apenas entre si e as mulheres apenas 
entre si, quantas diferentes classificações são possíveis? 


Solução (a) Como cada classificação corresponde a um arranjo particular 
das 10 pessoas, a resposta é 10! = 3.628.800. 


(b) Como há 6! possíveis classificações dos homens entre si e 4! clas- 
sificações possíveis das mulheres entre si, segue do princípio bá- 
sico que há (6!)(4!)=(720)(24) = 17280 classificações possíveis 
neste caso. [a] 


Exemplo 3c 


A Sra. Jones possui dez livros que pretende colocar em sua prateleira. Destes, 
quatro são de matemática, três são de química, dois são de história e um é um 
livro de línguas. A Sra. Jones deseja arranjá-los de forma que todos os livros 
que tratam do mesmo assunto permaneçam juntos na prateleira. Quantos dife- 
rentes arranjos são possíveis? 


Solução Há4!3!2!1! arranjos referentes ao alinhamento dos livros de ma- 
temática, depois dos livros de química, história e de línguas. Similarmente, para 
cada ordem de assuntos possível, há 413! 2! 1! arranjos. Portanto, como há 4! 
possíveis ordens de assuntos, a resposta desejada é 414! 31211! = 6912. a 
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Vamos agora determinar o número de permutações de um conjunto de n obje- 
tos quando não for possível distinguir certos objetos de outros. Para tornar essa 
situação um pouco mais clara, considere o exemplo a seguir. 


Exemplo 3d 


Quantos diferentes arranjos de letras podem ser formados a partir das letras 
PEPPER? 


Solução Primeiro notamos que as letras P,E,P,P,E,R permitem 6! permuta- 
ções quando os 3P's e os 2Eºs são diferentes uns dos outros. Entretanto, consi- 
dere qualquer uma destas permutações — por exemplo, P,P,E,P,E,R. Se agora 
permutarmos os P's e os Es entre si, então o arranjo resultante continuará a ser 
PPEPER. Isto é, todas as 3!2! permutações 


P,P,E,P3E2;R 
P,P3E,P,E;R 
PP, E,P3E;R 
PP,E,P, ER 
PP, E,P,ER 
P3P,E,P, ER 


PP, E,P3EjR 
P,P3E,P,E;R 
PP E,P3EjR 
P,PE,P ER 
PP, E,P,EjR 
P3P,E,P, ER 


são da forma PPEPER. Portanto, há 6!/(3! 2!) = 60 arranjos possíveis das letras 
PEPPER. E 


Em geral, o mesmo raciocínio usado no Exemplo 3d mostra que há 


n! 
ny! no! air ny! 
permutações diferentes de n objetos, dos quais n, são parecidos, n, são pareci- 
dos,...,n, são parecidos. 


Exemplo 3e 


Um torneio de xadrez tem dez competidores, dos quais quatro são russos, três 
são dos Estados Unidos, dois são da Grã-Bretanha e um é do Brasil. Se o resul- 
tado do torneio listar apenas a nacionalidade dos jogadores em sua ordem de 
colocação, quantos resultados serão possíveis? 


Solução Há 
10! 


resultados possíveis. m 


Exemplo 3f 


Quantos diferentes sinais, cada um deles formado por nove bandeiras alinha- 
das, podem ser feitos a partir de um conjunto de quatro bandeiras brancas, três 
bandeiras vermelhas e duas bandeiras azuis se todas as bandeiras de mesma cor 
forem idênticas? 
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Solução Há 
9! 


aaa 0 


sinais diferentes. E 


1.4 COMBINAÇÕES 


Estamos frequentemente interessados em determinar o número de grupos dife- 
rentes de r objetos que podem ser formados a partir de um total de n objetos. Por 
exemplo, quantos diferentes grupos de 3 podem ser selecionados dos 5 itens 4, 
B,C,De E? Para responder a essa questão, pense da seguinte forma: como há 5 
maneiras diferentes de selecionar o item inicial, 4 maneiras de selecionar o item 
seguinte e 3 maneiras de selecionar o item final, há portanto 5 - 4 - 3 maneiras de 
selecionar o grupo de 3 quando a ordem de seleção dos itens for relevante. En- 
tretanto, como cada grupo de 3 — por exemplo, o grupo formado pelos itens 4, B 
e C-—será contado 6 vezes (isto é, todas as permutações ABC, ACB, BAC, BCA, 
CAB e CBA serão contadas quando a ordem da seleção for relevante), tem-se 
que o número total de grupos que podem ser formados é igual a 


5.4.3 


oa O 


Em geral, como n(n — 1) - - -(n—r + 1) representa o número de diferentes ma- 
neiras pelas quais um grupo de r itens pode ser selecionado a partir de n itens 
quando a ordem da seleção é relevante, e como cada grupo de r itens será con- 
tado r! vezes, tem-se que o número de grupos diferentes de r itens que podem 
ser formados a partir de um conjunto de n itens é 


n(n — Dn —r+ 1 n! 
H! “(non 


Notação e terminologia 
E n 
Definimos ( Ê ). para r = n, como 


ny n! 
(1-5 


; n : nã A 
E dizemos que ( E ) representa o número de combinações possíveis de n 


objetos em grupos de r elementos de cada vez.* 


* Por convenção, define-se O! = 1. Com isso, a = E ) = 1. Além disso, assume-se 


n 
ave 7) - oquandoi <ocu = 
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: n ; : 
Assim, ( p! ) representa o número de grupos diferentes com r elementos 


que podem ser selecionados de um conjunto de n objetos quando a ordem da 
seleção não é considerada relevante. 


Exemplo 4a 


Um comitê de três pessoas deve ser formado a partir de um grupo de 20 pes- 
soas. Quantos comitês diferentes são possíveis? 
3) 


AA q e 1140 comitês possíveis. E 


Solução Ha( 
Exemplo 4b 


De um grupo de cinco mulheres e sete homens, quantos comitês diferentes for- 
mados por duas mulheres e três homens podem ser formados? E se dois dos 
homens estiverem brigados e se recusarem a trabalhar juntos? 


Solução Como há O) grupos possíveis de duas mulheres e (5) gru- 
pos possíveis de três homens, o princípio básico diz que há C (1) = 


5.4) 7.6-5 
(5) CAR 350 comitês possíveis formados por duas mulheres e três 


homens. 
Suponha agora que dois dos homens se recusem a trabalhar juntos. Como um total 


de ( : ) ( : ) = 5 dos ( : ) = 35 grupos possíveis de três homens contém os 


dois homens brigados, tem-se 35 — 5 = 30 grupos não contendo ambos os homens 
brigados. Como há ainda ( A ) = 10 maneiras de escolher as duas mulheres, há 


30 - 10 = 300 comitês possíveis neste caso. E 


Exemplo 4c 


Considere um conjunto de n antenas das quais m apresentam defeito en -m 
funcionam, e suponha que não seja possível distinguir as antenas defeituosas 
daquelas que funcionam. Quantos alinhamentos podem ser feitos sem que duas 
antenas com defeito sejam colocadas lado a lado? 


Solução Imagine que as n — m antenas que funcionam sejam alinhadas entre 
si. Agora, se não for permitido que duas antenas com defeito sejam colocadas 
lado a lado, então os espaços entre as antenas que funcionam devem conter no 
máximo uma antena defeituosa. Isto é, nas n —- m + 1 posições possíveis — re- 
presentadas na Figura 1.1 por acentos circunflexos — entre as n — m antenas que 
funcionam, devemos selecionar m espaços onde colocar as antenas defeituosas. 


22 Probabilidade: Um Curso Moderno com Aplicações 


nalnlant.canlala 


1 = funcional 


a = lugar para no máximo uma antena defeituosa 


Figura 1.1 Sem defeitos consecutivos. 


Portanto, há ( di e is ) ordenações possíveis nas quais há pelo menos uma 
antena que funciona entre duas defeituosas. E 
A identidade a seguir é útil em análise combinatória: 
n n-—1 n-1 
= < < 
(] (121) +( O asren (41) 


A Equação (4.1) pode ser provada analiticamente ou com o seguinte argumen- 
to combinatório: considere um grupo de n objetos e fixe sua atenção em um 


deles — chame-o objeto 1. Agora, há ( E = : ) grupos de tamanho r contendo 
o objeto 1 (pois cada grupo é formado selecionando-se r - 1 dos n — 1 objetos 


restantes). Além disso, há e 1 ) grupos de tamanho r que não contêm o 


objeto 1. Como há um total de ( y ) grupos de tamanho r, tem-se como resul- 
tado a Equação (4.1). 
Os valores ( E ) são frequentemente chamados de coeficientes binomiais 


por causa de sua proeminência no teorema binomial. 


O teorema binomial 


e +y"= 


Vamos apresentar duas demonstrações do teorema binomial. A primeira é 
uma demonstração por indução matemática e a segunda baseia-se em conside- 
rações combinatórias. 


Demonstração do teorema binomial por indução: Quando n = 1,a Equação 
(4.2) reduz-se a 
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Suponha a Equação (4.2) para n — 1. Agora, 


G+y=g+ya+ yo 


k=0 
emo n 1 Ra n-1 
= >. ( JRR Ex , ( k Jar 
k=0 k=0 


Fazendo i = k + 1 na primeira soma e i = k na segunda soma, vemos que 


n “4 . . n—1 e 
+= (ET ir E (" ; Jr 
i=0 


i=1 


ERA e SR o 
es S(12D+("; por +» 
j=1 
i 


n 
( H ) yr 
l 
i=0 


t 


onde a penúltima igualdade vem da Equação (4.1). Por indução, o teorema está 
agora demonstrado. 


Demonstração combinatória do teorema binomial: Considere o produto 


Oq + IDO + 7) + yn) 


Sua expansão consiste na soma de 2” termos, cada um deles sendo o produto de 
n fatores. Além disso, cada um dos 2” termos da soma apresenta x, ou y, como 
fator para cada i = 1,2,...,n. Por exemplo, 


(1 + ydG + y)=xx2 + 2x2 + yu + ya 


Agora, quantos dos 2º termos da soma vão ter k dos x/se (n — k) dos y/s como 
fatores? Como cada termo consistindo em k dos x;s e (n — k) dos y/s correspon- 


«tn 
de a uma escolha de um grupo de k dos n valores x,, x,,..., x,, há k ) termos 


como este. Assim, fazendo x, = x,y, = y,i = 1,...,n, vemos que 


x +y"= El 


k=0 


Exemplo 4d 
Expanda (x + y)”. 
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Solução 
3 3 3 3 
eesr=(6)e + (Jr) (3) 
= + 3 + 32y + x mn 
Exemplo 4e 


Quantos subconjuntos existem em um conjunto de n elementos? 


Solução Como há ( f ) subconiumtos de tamanho k, a resposta desejada é 


k 
hn n n 
> (1)=a +» =, 


k=0 


Esse resultado também poderia ter sido obtido atribuindo-se o número O ou o 
número 1 a cada elemento pertencente ao conjunto. A cada atribuição de nú- 
meros corresponderia, em uma relação um para um, um subconjunto formado 
por todos os elementos que receberam o valor 1. Como há 2º atribuições possí- 
veis, obter-se-ia dessa forma o resultado esperado. 

Note que incluímos o conjunto de O elementos (isto é, o conjunto vazio) 
como um subconjunto do conjunto original. Portanto, o número de subconjun- 
tos que contêm pelo menos um elemento é iguala 2" — 1. E 


1.5 COEFICIENTES MULTINOMIAIS 


Nesta seção, consideramos o seguinte problema: um conjunto de n itens dis- 
tintos deve ser dividido em r grupos distintos de tamanhos n,, n,,..., n, respec- 


tivamente, onde >; 1; = n. Quantas divisões diferentes são possíveis? Para 


m 


responder a essa questão, notamos que há | ” ) escolhas possíveis para o 
mn ada afn-n 
primeiro grupo; para cada escolha do primeiro grupo, há ( a 1 ) escolhas 


possíveis para o segundo grupo; para cada escolha dos dois primeiros gru- 


«fn-n—n guns ; : 
pos, há ( e E ) escolhas possíveis para O terceiro grupo, e assim por 
3 


diante. Daí sucede da versão generalizada do princípio básico da contagem 
que existem 


n nh— m H—hno— no > — A,-53 
m na Rr 


= n! (n — ny)! q RSA Ds Riad 
Gn — ndimi(n — mn — no)! no! O!n,! 
n! 


“Caglno!-n! 


divisões possíveis. 


Capítulo 1 « Análise Combinatória 25 


Outra maneira de visualizar esse resultado é considerar os n valores 1,1.,..., 
1,2,...,2,..., r,..., r, onde i aparece n, vezes, para i = 1,..., r. Cada permutação 
desses valores corresponde a uma divisão dos n itens em r grupos da seguinte 
maneira: suponha que a permutação i,, i,,...,i, corresponda à atribuição do item 
1 ao grupo i,, do item 2 ao grupo i, e assim por diante. Por exemplo, se n = 8 
esen,=4,n, = 3,en, = 1, então a permutação 1, 1,2,3,2,1,2,1 corresponde 
à atribuição dos itens 1, 2,6, 8 ao primeiro grupo, dos itens 3, 5, 7 ao segundo 
grupo, e do item 4 ao terceiro grupo. Como cada permutação leva a uma divisão 
dos itens e toda divisão possível é resultado de alguma permutação, tem-se que 
o número de divisões de n itens em r grupos distintos de tamanhos n,, 1,,...,n, É 
igual ao número de permutações de n itens dos quais n, são semelhantes, n, são 
semelhantes,..., e n, são semelhantes, o que se mostrou na Seção 1.3 ser igual a 

n! 


natna! no 
Notação 


Sen, +n, +... +n, = n, definimos como 
n NB, Rr 


n = n! 
nho... mtno!---n;! 


a ) representa o número de divisões possíveis de n 
2 0+r 


n 
ny,ho,... 
objetos distintos em r grupos distintos de tamanhos n,, n,,..., n,, respecti- 
vamente. 


Assim, ( 


Exemplo 5a 


Um dos departamentos de polícia de um vilarejo é formado por 10 policiais. Se 
a política do departamento é a de possuir 5 dos policiais patrulhando as ruas, 
2 deles trabalhando todo o tempo na delegacia e 3 deles de reserva, quantas 
divisões diferentes dos 10 policiais nos três grupos são possíveis? 


10! 
Solução Há -—— SI231 = 2520 divisões possíveis. E 


Exemplo 5b 


Dez crianças devem ser divididas em dois times 4 e B com 5 crianças cada. O 
time A joga em uma liga e o time B em outra. Quantas divisões diferentes são 
possíveis? 


10! 


Solução Há q 15] 


= 252 divisões possíveis. = 


26 Probabilidade: Um Curso Moderno com Aplicações 


Exemplo 5c 


Para jogar uma partida de basquete, 10 crianças dividem-se em dois times de 5 
cada. Quantas divisões diferentes são possíveis? 


Solução Note que este exemplo difere do Exemplo Sb porque agora a ordem 

dos dois times é irrelevante. Isto é, não há times A e B, mas apenas uma divisão 

que consiste em 2 grupos com 5 crianças cada. Portanto, a resposta desejada é 
101/65!5D 


7 126 E 


A demonstração do teorema a seguir, que generaliza o teorema binomial, é 
deixada como exercício. 


O teorema multinomial 


Grntetai=o 5 


A4,hn92,... 
(mm... my): 
nm+H+tn=n 


Isto é, faz-se a soma de todos os vetores com valores inteiros não negativos 
(n,,1,,...,n,) de forma quen, +n, +... +n,=n. 


Os números ( ) são conhecidos como coeficientes multinomiais. 


Hyho,...shy, 


Exemplo 5d 


Na primeira rodada de um torneio de mata-mata envolvendo n=2” jogadores, 
os n jogadores são divididos em n/2 pares, com cada um desses pares jogan- 
do uma partida. Os perdedores das partidas são eliminados e os vencedores 
disputam a próxima rodada, onde o processo é repetido até que apenas um 
jogador permaneça. Suponha que tenhamos um torneio de mata-mata com 8 
Jogadores. 


(a) Quantos resultados possíveis existem para a rodada inicial? (Por exemplo, 
um resultado é 1 vence 2,3 vence 4,5 vence 6 e 7 vence 8.) 


(b) Quantos resultados são possíveis para o torneio, supondo que um resulta- 
do forneça a informação completa de todas as rodadas? 


Solução Uma maneira de determinar o número de resultados possíveis para 
a rodada inicial é primeiramente determinar o número de pares possíveis para 
essa rodada. Para isso, note que o número de maneiras de dividir os 8 jogado- 
res em um primeiro par, um segundo par, um terceiro par e um quarto par é 
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1 
6 = a Assim, o número de pareamentos possíveis quando não há 
2,2,2,2 24 8! 


ordenação dos 4 pares é XT Para cada pareamento como esse, há 2 escolhas 
possíveis de cada par quanto ao vencedor daquele jogo, o que mostra que há 
82! 8! Ei 

ET resultados possíveis para a primeira rodada (outra maneira de ver 
isso é notar que há ( à) escolhas possíveis dos 4 vencedores e, para cada uma 


dessas escolhas, há 4! maneiras de se formar pares entre os 4 vencedores e os 
| 


8 8! 
4 perdedores, o que mostra que há 4! ( a] ET resultados possíveis para a pri- 


meira rodada). 
uia de 4! 
Similarmente, para cada resultado da primeira rodada, há x resultados 
possíveis para a segunda rodada, e para cada um dos resultados das primeiras 
1 


2! : 
duas rodadas há T resultados possíveis para a terceira rodada. Consequente- 


mente, pela versão generalizada do princípio básico da contagem, o torneio 

814!2! 
TIA 
usado para mostrar que um torneio de mata-mata de n = 2” jogadores tem n! 
resultados possíveis. 

Conhecendo o resultado anterior, não é difícil elaborar um argumento mais 
direto mostrando que existe uma correspondência um para um entre o conjun- 
to de possíveis resultados do torneiro e o conjunto das permutações de 1....,n. 
Para obter tal correspondência, classifique os jogadores da seguinte forma para 
cada resultado do torneio: atribua ao vencedor do torneiro o número 1 e ao 
vice-campeão o número 2. Aos jogadores que perderam na semifinal, atribua o 
número 3 àquele que perdeu para o campeão e o número 4 àquele que perdeu 
para o vice-campeão. Aos quatro jogadores que perderam nas quartas de final, 
atribua o número 5 àquele que perdeu para o campeão, 6 àquele que perdeu 
para o vice-campeão, 7 àquele que perdeu para o terceiro colocado, e 8 aque- 
le que perdeu para o quarto colocado. Continuando dessa maneira, acaba-se 
atribuindo um número a cada jogador (uma descrição mais sucinta é obtida ao 
atribuir-se ao campeão do torneio o número 1 e ao jogador que perdeu em uma 
rodada com 2º partidas o número do jogador que o venceu mais 2*, onde k = 
O,...,m — 1). Dessa maneira, o resultado do torneio pode ser representado por 
uma permutação i,, i,...., à,, onde i; corresponde ao jogador ao qual atribuiu-se o 
número j. Como diferentes resultados do torneio dão origem a diferentes per- 
mutações e como existe um resultado diferente do torneio para cada permuta- 
ção, tem-se o mesmo número de resultados possíveis para o torneiro quanto de 
permutações de 1....,n. E 


t = 8! resultados possíveis. De fato, o mesmo argumento pode ser 
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Exemplo 5e 
2 2 2,00 2 0,240 
(1 + x + x3)” = 2,0,0 XIX + 0,2,0 X53 
+ 


2 0,0,2 2 1,10 
EO ) XX5X3 + 1,1,0 X1X9X3 
= +15 +24 + 2x2 + 2x1x3 + 21213 1] 


*1.6 O NÚMERO DE SOLUÇÕES INTEIRAS DE EQUAÇÕES 


Existem 7” resultados possíveis quando n bolas diferentes são distribuídas em 
r urnas distintas. Isso ocorre porque cada bola pode ser colocada em cada uma 
das r urnas. No entanto, suponhamos agora que não seja possível distinguir as 
n bolas entre si. Nesse caso, quantos resultados diferentes são possíveis? Como 
não há diferença entre as bolas, tem-se que o resultado do experimento que 
envolve distribuir as n bolas entre as r urnas pode ser descrito por um vetor (x,, 
X2» X,), onde x, indica o número de bolas depositadas na i-ésima urna. Portan- 
to, o problema reduz-se a encontrar o número de vetores com valores inteiros 
não negativos (x,,x,,...,X,) tais que 


Mto +. +x=n 


Para computar esse número, comecemos considerando o número de soluções 
inteiras positivas. Com esse objetivo, imagine que tenhamos n objetos idênticos 
alinhados e que queiramos dividi-los em r grupos não vazios. Para fazer isso, 
podemos selecionar r — 1 dos n — 1 espaços entre objetos adjacentes como nos- 
sos pontos divisórios (veja a Figura 1.2). Por exemplo, se tivermos n = 8er =3, 
e escolhermos os dois divisores de forma a obter 


000/000/00 


então o vetor resultante é x,=3, x, = 3,x, = 2. Como há fé E : ) seleções 


possíveis, temos a seguinte proposição. 


040n04...n040 


n objetos O 


Escolha r — 1 dos espaços n. 


Figura 1.2 Número de soluções positivas. 


* Asteriscos indicam que o material é opcional. 
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Era : n-—l aê rea, : 
Proposição 6.1 Existem ( | )vetores distintos com valores inteiros posi- 


tivos (x,, X,,...,x,) satisfazendo a equação 


gro +e+x=n x>0i=),...r 


Para obter o número de soluções não negativas (em vez de positivas), 
note que o número de soluções não negativas de x, + x, +... + x, = n é igual 
ao número de soluções positivas de y, + y +... + y =n+r(o que se vê ao 
fazer y, =x, + 1,i = 1,..,7). Portanto, da Proposição 6.1, obtemos a seguinte 
proposição. 


Edo : — 1 E Ste 
Proposição 6.2 . Existem ( ” Ea á 1 ) vetores distintos com valores inteiros 


não negativos satisfazendo a equação 
x+xw+.tx,=n (6.1) 


Exemplo 6a 
Quantas soluções com valores inteiros não negativos de x, + x, = 3 são possíveis? 


e 3 = 4 soluções: (0,3), (1,2), (2,1), (3,0). = 


Solução Há ( 2-4 


Exemplo 6h 


Um investidor tem 20 mil reais para aplicar entre 4 investimentos possíveis. 
Cada aplicação deve ser feita em unidades de mil reais. Se o valor total de 20 
mil for investido, quantas estratégias de aplicação diferentes são possíveis? E se 
nem todo o dinheiro for investido? 


Solução Se fizermos com que x,i = 1,2,3,4, represente o número de milha- 
res de reais aplicados no investimento i, quando todo o montante tiver de ser 
investido, x,, x,, X,, x, Serão inteiros satisfazendo a equação 


vm +x +13 +x4=20 x;=0 


Portanto, pela Proposição 6.2, há( E ) = 1771 estratégias de investimento pos- 


síveis. Se nem todo o dinheiro precisar ser investido e se atribuirmos a x, o mon- 
tante de dinheiro mantido em reserva, cada estratégia corresponderá a um vetor 
(X1, X,, X3, X4, X5) com valores inteiros não negativos satisfazendo a equação 


x + x) + x3 + x4 + x5=20 
Ea ; 241. E fat 
Portanto, pela Proposição 6.2, existem 4 )J> 10.626 estratégias possíveis. E 


Exemplo 6c 
Quantos termos existem na expansão multinomial de (x, + x, +... + x)? 
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Solução 


n 
O + x + +55 (a e mB 


onde se faz a soma de todos os valores inteiros não negativos (n,....,n,) de for- 


ma que n, +... + n, = n. Portanto, pela Proposição 6.2, existem [ ” dd 
q 1 r p p r-1 


termos como esse. - = 


Exemplo 6d 


Consideremos novamente o Exemplo 4c, no qual tínhamos um conjunto de n 
itens, dos quais m são (indistinguíveis e) defeituosos e os restantes n — m são 
funcionais (mas também indistinguíveis). Nosso objetivo é determinar o núme- 
to de ordenações lineares nas quais não existam itens defeituosos em posições 
adjacentes. Para determinar esse número, imaginemos que os itens defeituo- 
sos estejam todos alinhados e que os funcionais devam agora ser posicionados. 
Chamemos de x, o número de itens funcionais à esquerda do primeiro item 
defeituoso, x, o número de itens funcionais entre os dois primeiros defeituosos, 
e assim por diante. Isto é, temos, esquematicamente, 


x10x20--:Xm Oxm41 


“Agora, haverá pelo menos um item funcional entre qualquer par de itens de- 
feituosos desde que x, > 0,i = 2,..., m. Com isso, o número de resultados que 
satisfazem essa condição é o número de vetores x,,..., x, ,) que satisfazem a 
equação 


ga +ctimn=n-om 220,%m0120,x%>0,1i=2,...,m 


Mas, fazendo com que y, =x, +1,y=X,1=2,..,M,Yms E Xym + 1, vemos 
que esse número é igual ao número de vetores positivos (»,,..., Y+1) que satis- 
fazem a equação 


py te +tIma=n-mA+ 2 


n>-om+1 
m 


Com isso, pela Proposição 6.1, existem ( ) resultados como esse, O 


que está de acordo com os resultados do Exemplo 4c. 

Suponha agora que estejamos interessados no número de resultados nos 
quais cada par de itens defeituosos esteja separado por pelo menos dois itens 
que funcionam. Usando o mesmo raciocínio aplicado anteriormente, isso é 
igual ao número de vetores que satisfazem a equação 


M+toctíma=n-m mn=20,xm120,x=2,i=2,...,m 
Aofazery =x +1Ly=X-1Li=2,..05,M,Y E Xymm + 1, vemos que esse 
resultado é igual ao número de soluções positivas da equação 


»toc+tYImi=n-lm+ 3 
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n-2m+2 


a ) resultados como esse. E 


Portanto, da Proposição 6.1, existem ( 


RESUMO 


O princípio básico da contagem diz que se um experimento constituído por 
duas fases for tal que existam n possíveis resultados na fase 1 e, para cada um 
desses n resultados, existam m possíveis resultados na fase 2, então o experi- 
mento terá nm resultados possíveis. 

Existem n! = n(n-1)-- 3: 2: 1 ordenações lineares possíveis de n itens. A 
grandeza 0! é por definição igual a 1. 


Seja 
n o n! 
ij (n-dli! 


quando 0 = i =1n,e 0 do contrário. Essa grandeza representa o número de di- 
ferentes subgrupos de tamanho i que podem ser formados em um conjunto de 
tamanho n. Ela é frequentemente chamada de coeficiente binomial por causa 
de seu destaque no teorema binomial, que diz que 


(x +y”= a ( a je 
1=0 


Para inteiros não negativos n,,...,n, cuja soma é n, 


n n! 
nyh2o,...shr “mlng!--n! 


corresponde ao número de divisões de n itens em r subgrupos não superpostos 
de tamanhos n,, n,,...,1,. 


PROBLEMAS 
1.1 (a) Quantas placas de carro diferentes refa. Quantas alocações diferentes são 
com 7 caracteres podem ser formadas possíveis? 


1.4 João, Júlio, Jonas e Jacques formaram 
uma banda com quatro instrumentos. Se 
cada um dos garotos é capaz de tocar to- 
dos os instrumentos, quantas diferentes 
combinações são possíveis? E se João e 
Júlio souberem tocar todos os quatro ins- 
trumentos, mas Jonas e Jacques souberem 


se os dois primeiros campos da placa 
forem reservados para as letras e os 
outros cinco para os números? 

(b) Repita a letra (a) supondo que nenhu- 
ma letra ou número possa ser repeti- 
do em uma mesma placa. 

1.2 Quantas sequências de resultados são 


possíveis quando um dado é rolado qua- 
tro vezes, supondo, por exemplo, que 3, 
4,3,1 é o resultado obtido se o primeiro 
dado lançado cair no 3, o segundo no 4, o 
terceiro no 3 e o quarto no 1? 


1.3 Vinte trabalhadores serão alocados em 


vinte tarefas diferentes, um em cada ta- 


tocar cada um deles apenas o piano e a 
bateria? 

Por muitos anos, os códigos telefônicos de 
área nos EUA e no Canadá eram forma- 
dos por uma sequência de três algarismos. 
O primeiro algarismo era um inteiro entre 
2 e 9,0 segundo algarismo era 0 ou l,e o 
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terceiro digito era um inteiro entre 1 e 9. 
Quantos códigos de área eram possíveis? 
Quantos códigos de área começando com 
um 4 eram possíveis? 
1.6 Uma famosa canção de ninar começa 
com os versos 
“Quando ia para São Ives, 
Encontrei um homem com 7 mulheres. 
Cada mulher tinha 7 sacos. 
Cada saco tinha 7 gatos. 
Cada gato tinha 7 gatinhos...” 
Quantos gatinhos o viajante encon- 
trou? 

1.7 (a) De quantas maneiras diferentes 3 ga- 
rotos e 3 garotas podem sentar-se em 
fila? 

(b) De quantas maneiras diferentes 3 ga- 
rotos e 3 garotas podem sentar-se em 
fila se os garotos e as garotas senta- 
rem-se juntos? 

(c) E se apenas os garotos sentarem-se 
juntos? 

(d) E se duas pessoas do mesmo sexo não 
puderem se sentar juntas? 

1.8 Quantos arranjos de letras diferentes po- 
dem ser feitos a partir de 

(a) Sorte? 

(b) Propose? 

(c) Mississippi? 

(d) Arranjo? 

1.9 Uma criança tem 12 blocos, dos quais 6 

são pretos, 4 são vermelhos, 1 é branco e 

1 é azul. Se a criança colocar os blocos em 

linha, quantos arranjos são possíveis? 

1.10 De quantas maneiras 8 pessoas podem se 
sentar em fila se 
(a) não houver restrições com relação à 

ordem dos assentos? 

(b) as pessoas 4 e B tiverem que se sen- 
tar uma ao lado da outra? 

(c) houver 4 homens e 4 mulheres e não 
for permitido que dois homens ou 
duas mulheres se sentem em posições 
adjacentes? 

(d) houver 5 homens e for necessário que 
eles se sentem lado a lado? 

(e) houver 4 casais e cada casal precisar 
sentar-se junto? 

1.11 De quantas maneiras três romances, dois 
livros de matemática e um livro de química 
podem ser arranjados em uma prateleira se 
(a) eles puderem ser colocados em qual- 

quer ordem? 


(b) for necessário que os livros de mate- 
mática figuem juntos e os romances 
também? 

(c) for necessário que os romances fiquem 
juntos, podendo os demais livros ser 
organizados de qualquer maneira? 

1.12 Cinco prêmios diferentes (melhor desem- 
penho escolar, melhores qualidades de 
liderança, e assim por diante) serão dados 
a estudantes selecionados de uma classe 
de trinta alunos. Quantos resultados dife- 
rentes são possíveis se 
(a) um estudante puder receber qualquer 

número de prêmios? 

(b) cada estudante puder receber no má- 
ximo um prêmio? 

1.13 Considere um grupo de vinte pessoas. Se 
todos cumprimentarem uns aos outros 
com um aperto de mãos, quantos apertos 
de mão serão dados? 

1.14 Quantas mãos de pôquer de cinco cartas 
existem? 

1.15 Uma turma de dança é formada por 22 
estudantes, dos quais 10 são mulheres e 
12 são homens. Se 5 homens e 5 mulhe- 
res forem escolhidos para formar pares, 
quantas combinações diferentes serão 
possíveis? 

1.16 Um estudante tem que vender 2 livros de 
uma coleção formada por 6 livros de ma- 
temática, 7 de ciências e 4 de economia. 
Quantas escolhas serão possíveis se 
(a) ambos os livros devem tratar do mes- 

mo assunto? 

(b) os livros devem tratar de assuntos 
diferentes? 

1.17 Sete presentes diferentes devem ser dis- 
tribuídos entre 10 crianças. Quantos re- 
sultados diferentes são possíveis se ne- 
nhuma criança puder receber mais de um 
presente? 

1.18 Um comitê de 7 pessoas, formado por 2 
petistas, 2 democratas e 3 peemedebis- 
tas deve ser escolhido de um grupo de 5 
petistas, 6 democratas e 4 peemedebistas. 
Quantos comitês são possíveis? 

1.19 De um grupo de 8 mulheres e 6 homens, 
pretende-se formar um comitê formado 
por 3 homens e 3 mulheres. Quantos co- 
mitês diferentes são possíveis se 
(a) 2 dos homens se recusarem a traba- 

lhar juntos? 


(b) 2 das mulheres se recusarem a traba- 
lhar juntas? 

(c) 1 homem e 1 mulher se recusarem a 
trabalhar juntos? 

1.20 Uma pessoa tem 8 amigos, dos quais 5 se- 
rão convidados para uma festa. 

(a) Quantas escolhas existem se dois dos 
amigos estiverem brigados e por esse 
motivo não puderem comparecer? 

(b) Quantas escolhas existem se dois dos 
amigos puderem ir apenas se forem 
juntos? 

1.21 Considere a malha de pontos mostrada a 
seguir. Suponha que, começando do pon- 
to 4, você possa ir um passo para cima 
ou para direita em cada movimento. Esse 
procedimento continua até que o ponto B 
seja atingido. Quantos caminhos possíveis 
existem entre A e B? 


Dica: Note que, para atingir B a partir de 
A, você deve dar quatro passos à direita e 
três passos para cima. 


B 


+ + + + 
A 


1.22 No Problema 21, quantos caminhos dife- 
rentes existem entre 4 e B que passam 
pelo ponto circulado mostrado na figura 
a seguir? 


A 


1.23 Um laboratório de psicologia dedicado a 
pesquisar os sonhos possui 3 quartos com 
2 camas cada. Se 3 conjuntos de gêmeos 
idênticos forem colocados nessas 6 camas 
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de forma que cada par de gêmeos durma 
em camas diferentes em um mesmo quar- 
to, quantas diferentes combinações são 
possíveis? 

1.24 Expanda (3% + y)). 

1.25 O jogo de bridge é jogado por 4 jogado- 
res, cada um deles com 13 cartas. Quantas 
jogadas de bridge são possíveis? 

1.26 Expanda (x, + 2x, + 3x,)'. 

1.27 Se 12 pessoas vão ser divididas em 3 co- 
mitês de 3,4 e 5 pessoas. Quantas divisões 
são possíveis? 

1.28 Se 8 professores novatos tiverem que ser 
divididos entre 4 escolas, quantas divisões 
são possíveis? E se cada escola puder re- 
ceber 2 professores? 

1.29 Dez halterofilistas disputam uma com- 
petição de levantamento de peso por 
equipes. Destes, 3 são dos EUA, 4 da 
Rússia, 2 da China e 1 do Canadá. Se 
a soma de pontos considerar os países 
que os atletas representam, mas não as 
identidades desses atletas, quantos dife- 
rentes resultados são possíveis? Quan- 
tos resultados diferentes correspondem 
à situação em que os EUA possuem um 
atleta entre os três primeiros e 2 entre 
os três últimos? 

1.30 Delegados de 10 países, incluindo Rús- 
sia, França, Inglaterra e os EUA, devem 
sentar-se lado a lado. Quantos arranjos de 
assentos diferentes são possíveis se os de- 
legados franceses e ingleses tiverem que 
sentar-se lado a lado e os delegados da 
Rússia e dos EUA não puderem sentar-se 
lado a lado. 

*1.31 Se 8 quadros-negros idênticos forem divi- 
didos entre quatro escolas, quantas divisões 
são possíveis? E se cada escola tiver que re- 
ceber pelo menos um quadro-negro? 

*1.32 Um elevador parte do subsolo com 8 
pessoas (não incluindo o ascensorista) 
e as deixa todas juntas ao chegar no úl- 
timo piso, no sexto andar. De quantas 
maneiras poderia o ascensorista perce- 
ber as pessoas deixando o elevador se 
todas elas parecessem iguais para ele? 
E se as 8 pessoas correspondessem a 5 
homens e 3 mulheres, e o ascensorista 
pudesse diferenciar um homem de uma 
mulher? 
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*1.33 Temos 20 mil reais que devem ser apli- 
cados entre 4 carteiras diferentes. Cada 
aplicação deve ser feita em múltiplos de 
mil reais, e os investimentos mínimos 
que podem ser feitos são de 2,2,3 e 4mil 


reais. Quantas estratégias de aplicação 

diferentes existem se 

(a) uma aplicação tiver que ser feita em 
cada carteira? 

(b) aplicações tiverem que ser feitas em 
pelo menos 3 das quatro carteiras? 


EXERCÍCIOS TEÓRICOS 


1.1 Demonstre a versão generalizada do prin- 
cípio básico da contagem. 

1.2 Dois experimentos serão realizados. O 
primeiro pode levar a qualquer um dos m 
resultados possíveis. Se o primeiro experi- 
mento levar ao resultado i, então o segun- 
do experimento pode levar a qualquer 
um dos n, resultados possíveis, com i = 
1,2,...,m. Qual é o número de resultados 
possíveis para os dois experimentos? 

1.3 De quantas maneiras podem r objetos ser 
selecionados de um conjunto de n objetos 
se a ordem de seleção for considerada re- 
levante? 


1.4 Existem ( : ) arranjos lineares diferentes 
de n bolas, das quais r são pretas en — » 


são brancas. Dê uma explicação combina- 
tória para este fato. 

1.5 Determine o número de vetores (x,....,x,) 
de forma que cada x, seja iguala Q ou l. e 


n 
DE >= k 
i=1 


1.6 Quantos vetores x,,..., x, existem para os 
quais cada x, é um inteiro positivo tal que 
l<x<nex<x,<.<x 

1.7 Demonstre analiticamente a Equação 
(4.1). 

1.8 Demonstre que 


(E=((2) (em) 
eo ()(8) 


Dica: Considere um grupo de n homens e 
m mulheres. Quantos grupos de tamanho 
r são possíveis? 


1,9 Use o Exercício Teórico 1.8 para demons- 
trar que 
200) o ny? 
nojo k 
k=0 
1.10 De um grupo de n pessoas, suponha que 
queiramos escolher um comitê de k, k = 
n, das quais uma será designada a presi- 
dente. 


(a) Mantendo o foco primeiro na escolha 
do comitê e então na escolha do presi- 


dente, mostre que há ( É ) k escolhas 


possíveis. 

(b) Mantendo o foco primeiro na esco- 
lha dos membros do comitê que não 
serão escolhidos como presidente e 
então na escolha do presidente, mos- 
tre que há (,, E o — k + 1) es- 


colhas possíveis. 

(c) Mantendo o foco primeiro na esco- 
lha do presidente e então na esco- 
lha dos demais membros do comitê, 


mostre que há n E E : ) escolhas 
possíveis. 
(d) Conclua das letras (a), (b) e (c) que 


(2) =meem(e 2 )on(i0i) 


(e) Use a definição fatorial de ( É ) para 
verificar a identidade mostrada na le- 
tra (d). 
1.11 A identidade a seguir é conhecida como a 
identidade combinatória de Fermat. 


(1)-=D(121) n=+ 


Forneça um argumento combinatório 
(cálculos não são necessários) para esta- 
belecer essa identidade. 
Dica: Considere o conjunto de números 1 
até n. Quantos subconjuntos de tamanho 
k possuem i como o seu membro de maior 
número? 

1.12 Considere a identidade combinatória a 
seguir: 


n 
De(k)=n qr 
k=1 


(a) Apresente um argumento combinató- 
rio para essa identidade considerando 
um conjunto de n pessoas e determi- 
nando, de duas maneiras, o número 
de possíveis seleções de um comitê de 
qualquer tamanho e de um presidente 
para o comitê. 

Dica: 

(i) Existem quantas seleções pos- 
síveis para um comitê de tama- 
nho k e seu presidente? 

(ii) Existem quantas seleções pos- 
síveis para um presidente e os 
demais membros do comitê? 

(b) Verifique a identidade a seguir para n 


=1,2,3,4,5: 

n 

D (E) =2"n0 + 
k=1 


Para uma demonstração combinatória 
da identidade anterior, considere um 
conjunto de n pessoas e mostre que 
ambos os lados da identidade repre- 
sentam o número de seleções diferen- 
tes de um comitê, seu presidente e seu 
secretário (que possivelmente acumu- 
la a função de presidente). 

Dica: 

(i) Quantas seleções diferentes re- 
sultam em um comitê contendo 
exatamente k pessoas? 

(ii) Existem quantas seleções dife- 
rentes nas quais o presidente 
e o secretário são os mesmos? 
(Resposta: n2"".) 

(iii) Quantas seleções diferentes 
resultam no presidente e no 
secretário sendo pessoas dife- 
rentes? 
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(c) Mostre agora que 


D(g)é=20a + 3) 


k=1 


1.13 Mostre que, para n > 0, 
n s/n 
Sit 
i=0 


Dica: Use o teorema binomial. 

1.14 De um grupo de n pessoas, deve-se esco- 
lher um comitê de tamanho j. Deste comi- 
tê, também será escolhido um subcomitê 
de tamanho i,i = j. 

(a) Deduza uma identidade combinató- 
ria para calcular, de duas maneiras, o 
número de escolhas possíveis para o 
comitê e o subcomitê — inicialmente 
supondo que o comitê seja escolhido 
antes do subcomitê, e depois supondo 
que o subcomitê seja escolhido antes 
do comitê. 

(b) Use a letra (a) para demonstrar a se- 
guinte identidade combinatória: 


ECO ()e* ves 


(c) Use a letra (a) e o Exercício Teórico 
1.13 para mostrar que 


EM) eurico cm 


jei 


1.15 Seja H,(n) o número de vetores x,,..., x, 
para os quais cada x, é um inteiro positivo 
satisfazendo | =x, <=nex <<<, 
(a) Sem quaisquer cálculos, mostre que 


H, (n) =n 


Hdm=> Head) k>1 
j=1 


Dica: Existem quantos vetores nos 
quaisx, =)? 
(b) Use a recursão anterior para calcular 
HS). 
Dica: Primeiro calcule H,(n) para n = 
1,2,3,4,5. 
1.16 Considere um torneio com n competido- 
res no qual o resultado é uma ordenação 
desses competidores, sendo permitidos 


Z 


empates. Isto é, o resultado divide os 
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jogadores em grupos, com o primeiro 
grupo sendo formado por aqueles que 
empataram em primeiro lugar, o grupo 
seguinte sendo formado por aqueles que 
empataram em segundo lugar, e assim 
por diante. Faça N(n) representar o nú- 
mero de diferentes resultados possíveis. 
Por exemplo, N(2) = 3, pois, em um tor- 
neio com 2 competidores, o jogador 1 po- 
deria ser unicamente o primeiro, o joga- 
dor 2 poderia ser unicamente o primeiro, 
ou eles poderiam empatar em primeiro. 
(a) Liste todos os resultados possíveis 
quando n = 3. 
(b) Com N(0) definido como igual a 1, mos- 
tre, sem realizar nenhum cálculo, que 
= n E 
neo = 5( E )ra o) 


i=1 


Dica: Existem quantos resultados nos 
quais i jogadores empatam em último 
lugar? 
(c) Mostre que a fórmula da letra (b) é 
equivalente a 
n-l ia 
Nm) =>, ( : )ro 
i=0 
(d) Use a recursão para determinar N(3) 
e N(4). 
1.17 Apresente uma explicação combinatória 
para 


1.18 Mostre que 


n = n-—1 
nho... = mo — 1,m, oh 
n-1 
aa = 1, ato 


Dica: Use um argumento similar àquele 
empregado para estabelecer a Equação 
(4.1). 

1.19 Demonstre o teorema multinomial. 

*1.20 De quantas maneiras n bolas idênticas po- 
dem ser distribuídas em r» urnas de forma 
que a i-ésima urna contenha pelo menos 
m, bolas, para cada i = 1,...,r? Suponha 
quen > 5iymi. 


*1.21 Mostre que existem exatamente E 


n-1 é 
Es ai k ) soluções de 
 +txwo + +x=n 


para as quais exatamente k dos xi são 
iguais a 0. 

*1.22 Considere uma função f(x,...., x,) de n 
variáveis. Quantas derivadas parciais de 
ordem r a função f possui? 

*1.23 Determine o número de vetores (x,,...,X,) 
tais que cada um seja um inteiro não ne- 
gativo e É 


n 
Bo <k 
i=1 


PROBLEMAS DE AUTOTESTE E EXERCÍCIOS 


11 Existem quantos arranjos lineares dife- 
rentes das letras A,B, C, D, E, F para os 
quais 
(a) A e B estão uma ao lado do outra? 
(b) A está antes de B? 

(c) A está antes de Be B antes de C? 

(d) A está antes de Be C antes de D? 

(e) A e B estão uma ao lado da outra e 
Ce D também estão uma ao lado da 
outra? 

(£) E não está na última linha? 

1.2 Se quatro americanos, 3 franceses e três 
britânicos devem sentar-se lado a lado, 


quantos arranjos de assentos são possí- 
veis quando for necessário que pessoas da 
mesma nacionalidade se sentem em posi- 
ções adjacentes? 

1.3 Um presidente, um tesoureiro e um secre- 
tário, todos diferentes, serão escolhidos de 
um clube formado por 10 pessoas. Quan- 
tas escolhas diferentes são possíveis se 
(a) não houver restrições? 

(b) Ac B não trabalharem juntos? 

(c) Ce D trabalharem juntos, senão não 
trabalharão em hipótese alguma? 

(d) E necessariamente ocupar um cargo? 


(e) F ocupar um cargo apenas se for pre- 
sidente? 

1.4 Uma estudante precisa responder a 7 
questões de 10 em um exame. Quantas es- 
colhas ela tem? E se ela precisar respon- 
der a 3 das primeiras 5 questões? 

1.5 De quantas maneiras diferentes pode um 
homem dividir 7 presentes entre seus três 
filhos se o mais velho tiver que receber 3 
presentes e os demais 2 presentes cada? 

1.6 Quantas placas de carro diferentes com 7 
caracteres são possíveis quando três das 
posições forem letras e 4 forem algaris- 
mos? Suponha que a repetição das letras 
e dos números seja possível e que não 
exista restrição quanto ao seu posiciona- 
mento. 

1.7 Dê uma explicação combinatória para a 
identidade 


()=-(12,) 


1.8 Considere números de n algarismos onde 
cada um deles é um dos 10 inteiros 0, 
1,..., 9. Quantos números existem para os 
quais 
(a) não há algarismos consecutivos iguais? 
(b) O aparece como um algarismo um to- 

tal de i vezes,i=0,...,n? 

1.9 Considere três classes, cada uma dela for- 
mada por n estudantes. Deste grupo de 3n 
estudantes, deve-se escolher um grupo de 
3 estudantes. 

(a) Quantas escolhas são possíveis? 

(b) Existem quantas escolhas nas quais 
todos os 3 estudantes vêm da mesma 
classe? 

(c) Existem quantas escolhas nas quais 
2 dos 3 estudantes estão na mesma 
classe e o outro está em uma classe 
diferente? 

(d) Existem quantas escolhas nas quais 
todos os 3 estudantes estão em classes 
diferentes? 

(e) Usando os resultados das letras (a) a 
(d), escreva uma identidade combi- 
natória. 

1.10 Quantos números de 5 algarismos podem 

ser formados a partir dos inteiros 1, 2...., 

9 se nenhum algarismo puder aparecer 

mais de duas vezes? (Por exemplo, 41434 

não é permitido.) 
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111 De 10 casais, queremos selecionar um 
grupo de 6 pessoas no qual a presença de 
um casal não é permitida. 

(a) Existem quantas escolhas possíveis? 

(b) Existem quantas escolhas possíveis se 
o grupo também tiver que ser forma- 
do por 3 homens e 3 mulheres? 

1.12 Deve-se escolher um comitê de 6 pessoas 
a partir de um grupo formado por 7 ho- 
mens e 8 mulheres. Se o comitê tiver que 
ser formado por pelo menos 3 mulheres e 
pelo menos 2 homens, é possível formar 
quantos comitês diferentes? 


*1.13 Uma coleção de artes formada por 4 Da- 


lis, 5 Van Goghs e 6 Picassos foi leiloada. 
No leilão havia 5 colecionadores de arte. 
Se um repórter tivesse anotado apenas o 
número de Dalis, Van Goghs e Picassos 
adquiridos por cada colecionador, quan- 
tos resultados diferentes poderiam ter 
sido registrados se todos os trabalhos ti- 
vessem sido vendidos? 


*1.14 Determine o número de vetores (x,,...,x,) 


tais que cada x, é um inteiro positivo e 
n 
a =<k 
i=1 


onde k = n. 

1.15 Um total de n estudantes está matricula- 
do em um curso de probabilidade. Os re- 
sultados dos exames vão listar os nomes 
dos alunos aprovados em ordem decres- 
cente de notas. Por exemplo, o resultado 
será “Bruno, Carlos” se Bruno e Carlos 
forem os únicos a terem sido aprovados, 
com Bruno recebendo a maior nota. Su- 
pondo que todas as notas sejam diferen- 
tes (sem empates), quantos resultados 
serão possíveis? 

1.16 Quantos subconjuntos de tamanho 4 do 
conjunto S = (1,2,...,20] contêm pelo me- 
nos um dos elementos 1,2,3,4,5? 

1.17 Verifique analiticamente a igualdade a 
seguir: 


n k n— k 
(5) = (5) + tmn 10 + ( 2 ). l=k=n 


Agora, forneça um argumento combina- 
tório para esta identidade. 

1.18 Em certa comunidade, há 3 famílias for- 
madas por um único pai e um filho, 3 fa- 
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mílias formadas por um único pai e 2 fi- 1.19 Se não houver restrições quanto ao po- 
lhos, 5 famílias formadas por 2 pais e um sicionamento dos números e das letras, 
filho único, 7 famílias formadas por 2 pais quantas placas de carro com 8 caracteres 
e 2 filhos, e 6 famílias formadas por 2 pais formadas por 5 letras e três números se- 
e 3 filhos. Se um pai e um filho de cada fa- rão possíveis se não for permitida a re- 
mília tiverem que ser escolhidos, existem petição de letras ou números? E se os 3 


quantas possibilidades de escolha? números tiverem que ser consecutivos? 
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eme im tio meets 


2.3 AXIOMAS DA PROBABILIDADE «+, Cs, Cd Ds 


2.1 INTRODUÇÃO 


Neste capítulo, introduzimos o conceito de probabilidade de um evento e em 
seguida mostramos como probabilidades podem ser calculadas em certas situa- 
ções. Antes disso, no entanto, necessitamos dos conceitos de espaço amostral e 
de eventos de um experimento. 


2.2 ESPAÇO AMOSTRAL E EVENTOS 


Considere um experimento cujo resultado não se pode prever com certeza. 
Entretanto, embora o resultado do experimento não seja conhecido antecipa- 
damente, vamos supor que o conjunto de todos os resultados possíveis seja 
conhecido. Esse conjunto é conhecido como o espaço amostral do experimento 
e é representado pela letra S. A seguir, temos alguns exemplos: 


1. Se o resultado de um experimento consiste na determinação do sexo de um 
bebê recém-nascido, então 


= [g,b] 


onde o resultado g significa que o bebê é menina e b que o bebê é menino. 
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2. Se o resultado de um experimento é a ordem de chegada de uma corrida 
entre 7 cavalos numerados de 1 a 7 então 


S = [todas as 7! permutações de (1,2,3,4,5,6,7)) 


O resultado (2,3,1,6,5,4,7) significa, por exemplo, que o cavalo número 2 
chegou em primeiro lugar, depois o cavalo número 3, depois o número 1, e 
assim por diante. 

3. Se o experimento consiste em jogar duas moedas, então o espaço amostral 
é formado pelos quatro pontos a seguir: 


S = (4,0), (4,D. (TH, (T,7) 


O resultado será (H, H) se ambas as moedas derem cara, (H, T) se a primei- 
ra moeda der cara e a segunda der coroa, (T, H) se a primeira der coroa e a 
segunda der cara, e (7, T) se ambas derem coroa. 

4. Se o experimento consiste em jogar dois dados, então o espaço amostral é 
formado por 36 pontos 


) = ((i,)): Lj = 1,2;3;4; 5, 6) 


onde o resultado (i, j) ocorre se i é o número que aparece no dado da es- 
querda e j é o número que aparece no outro dado. 

5. Se o experimento consiste em medir (em horas) o tempo de vida de um 
transistor, então o espaço amostral é formado por todos os números reais 
não negativos; isto é: 


S=([x0<=x<o) 


Qualquer subconjunto E do espaço amostral é conhecido como um evento. 
Em outras palavras, um evento é um conjunto formado pelos possíveis resul- 
tados do experimento. Se o resultado do experimento estiver contido em E, 
então dizemos que E ocorreu. A seguir listamos alguns exemplos de eventos. 

No Exemplo 1 anterior, se E = (g), então E é o evento em que o bebê é uma 
menina. Similarmente, se F = [b], então F é o evento em que o bebê é um menino. 

No Exemplo 2, se 


É = (todos os resultados em S começando com um 3) 


então E é o evento em que o cavalo 3 vence a corrida. 

No Exemplo 3,se E = ((H, H),(H, T)), então E é o evento em que a primei- 
ra moeda lançada dá cara. 

No Exemplo 4, se E = [(1,6), (2,5), (3,4), (4,3),(5,2), (6, 1), então E é o 
evento em que a soma dos dados é igual a 7. 

No Exemplo 5,se E = (x:0=x<5),então E é o evento em que o transistor 
não funciona mais que 5 horas. 

Para quaisquer dois eventos E e F de um espaço amostral S, definimos o 
novo evento E U F como sendo formado por todos os resultados que perten- 
cemaEouFoua Ee Fsimultaneamente. Isto é,o evento EU Focorreráse E 
ou F ocorrer. Por exemplo, no Exemplo 1,se o evento E = (ge F = (b), então 


EUF=[g,b) 
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Isto é, E U F corresponde a todo o espaço amostral S. No Exemplo 3, se E = 
(1, H),(H, MJ e F = (7, H)), então 


EUVF=(HD,(HD(T,H) 


Assim, E U Focorreria se desse cara em qualquer uma das duas moedas. 

O evento EU F é chamado de união dos eventos E e F. 

De forma similar, para quaisquer dois eventos E e F, também podemos de- 
finir o novo evento EF, chamado de interseção de E e F, como sendo formado 
por todos os resultados que estão tanto em E quanto em F. Isto é, o evento EF 
(às vezes escrito E N F) ocorre apenas se E e F ocorrerem. Por exemplo, no 
Exemplo 3,se E = ((H, H),(H, T),(T, H)) é o evento em que pelo menos uma 
cara aparece nas duas moedas e F = ((H, T),(T, H),(T, T)] é o evento em que 
pelo menos uma coroa aparece, então 


EnF=((H,7,(T,H)) 


é o evento em que exatamente uma cara e uma coroa aparecem. No Exemplo 4, 
se E = ((1,6), (2,5), (3,4), (4,3), (5,2), (6, 1)) é o evento em que a soma dos da- 
dos éiguala7 e F = [(1,5),(2,4),(3,3), (4,2), (5, 1)) é o evento em que a soma 
dos dados é igual a 6, então o evento EF não contém quaisquer resultados e 
portanto não poderia ocorrer. Tal evento é chamado de evento vazio e é re- 
presentado pelo símbolo (à (isto é, j se refere ao evento formado por nenhum 
resultado). Se EF = (j, então se diz que E e F são mutuamente exclusivos. 
Definimos uniões e interseções de mais de dois eventos de forma similar. Se 


E, E,,... são eventos, então a união desses eventos, representada como |) E,, é 


: n=1 
definida como o evento formado por todos os resultados que aparecem em E, 
para pelo menos um valor de n = 1,2,.... Similarmente, a interseção dos eventos 

pés 
E, representada como (7 En, é definida como o evento formado pelos resulta- 


n=1 
dos que aparecem em todos os eventos E,,n = 1,2... 


Finalmente, para qualquer evento E, definimos o novo evento E”, chama- 
do de complemento de E, como o evento formado por todos os resultados do 
espaço amostral que não estão contidos em E. Isto é, E“ ocorrerá se e somente 
se E não ocorrer. No Exemplo 4, se o evento E = ((1,6), (2,5), (3,4), (4,3),(5, 
2), (6,1)), então E“ ocorre quando a soma dos dados não for igual a 7, Note que, 
como o experimento deve levar a algum resultado, tem-se que Sº = (9. 

Para quaisquer dois eventos E e F,se todos os resultados em E também esti- 
verem em F, dizemos que E está contido em F, ou que E é um subconjunto de F, 
e escrevemos E C F (ou, de forma equivalente, F D E, quando às vezes F é cha- 
mado de superconjunto de E). Assim, se E C F, então a ocorrência de E implica 
a ocorrência de F. Se E C Fe FC E, dizemos que E e F são iguais e escrevemos 
E=F. 

Uma representação gráfica que ajuda na ilustração das relações lógicas en- 
tre eventos é o diagrama de Venn. O espaço amostral $ é representado como 
um grande retângulo e os eventos E, F, G,... são representados como todos os 
resultados presentes no interior de círculos colocados dentro desse retângu- 
lo. Eventos de interesse podem então ser indicados sombreando-se as regiões 
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y 


(b) Região sombreada: EF 


(c) Região sombreada: E“ 


Figura 2.1 Diagramas de Venn. 


apropriadas do diagrama. Por exemplo, nos três diagramas de Venn mostrados 
na Figura 2.1, as áreas sombreadas representam, respectivamente, os eventos E 
U F,EFe E. O diagrama de Venn na Figura 2.2 indica que E C F. 

As operações de formação de uniões, interseções e complementos de even- 
tos obedecem a certas regras similares às regras de álgebra. Listamos algumas 
destas regras: 


Leis comutativas EUF=FUE EF=FE 
Leis associativas (EUMUG=EU(FUG) (EFG= E(FG) 
Leis distributivas (EU PG = EGUFG EFUG=(EUG)ÍFUG) 


Essas relações são verificadas mostrando-se que qualquer resultado que está 
contido no evento no lado esquerdo da igualdade também está contido no seu 
lado direito, e vice-versa. Uma maneira de mostrar isso é utilizar diagramas de 
Venn. Por exemplo, a lei distributiva pode ser verificada pela sequência de dia- 
gramas mostrada na Figura 2.3. 


Figura2.2 EC. 
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E F E F 

e 
G G 

(a) Região sombreada: EG (b) Região sombreada: FG 


E F 


LAS 


G 
(c) Região sombreada: (E U F)JG 


Figura2.3 (EU BG =EGUFG. 


As expressões a seguir, que são bastante úteis e relacionam as três opera- 
ções básicas de formação de uniões, interseções e complementos, são conheci- 
das como [leis de DeMorgan: 


n E n 
UJe| =NE 
i=1 i=1 

c 


n n 
Ne| =JE 
i=1 i=1 


Para provar as leis de DeMorgan, suponha primeiro que x seja um resultado 


i=1 
contido em nenhum dos eventos E, i = 1,2,...,n. Isso implica que x está contido 
n 


c 
n n 
de (0 8) . Então x não está contido em [J Ei, o que significa que x não está 
i=1 E 


em Ef para todo i = 1,2,...,n e que portanto está contido em o) E;. Indo por 
n I= 
outro caminho, suponha que x seja um resultado de (7) Ef. Então x está contido 
i=1 
em E; para todo i = 1,2,...,n,o que significa que x não está contido em E, para 


n 
nenhum i = 1,2,...,n,0 que implica que x não está contido em [J E;. Por sua vez, 


c i 
n 
isso implica que x está contido em (0 E) - Isso demonstra a primeira das leis 


de DeMorgan. : 


Para provar a segunda lei de DeMorgan, usamos a primeira lei para obter 
c 


Us) =( Ye” 
i=1 i=1 
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que, já que (E9 = E, é equivalente a 


c 
Uz) = 
1 1 


Calculando os complementos de ambos os lados da equação anterior, obtemos 
o resultado esperado, isto é, 


c 


n n 
Us= (Ne 
1 1 


2.3 AXIOMAS DA PROBABILIDADE 


Uma maneira de definir a probabilidade de um evento é em termos de sua fre- 
quência relativa. Tal definição é feita da seguinte forma: suponhamos que um 
experimento, cujo espaço amostral é S, seja realizado repetidamente em con- 
dições exatamente iguais. Para cada evento E do espaço amostral S, definimos 
n(E) como o número de vezes que o evento E ocorre nas n primeiras repetições 
do experimento. Então, P(L), a probabilidade do evento E, é definida como 


p= tim 2 


n->500 n 


Isto é, P(E) é definida como a proporção (limite) de tempo em que E ocorre. 
Ela é também a frequência limite de E. 

Embora a definição anterior seja intuitivamente agradável e deva estar 
sempre na mente do leitor, ela possui um sério inconveniente: como saberemos 
que n(E)/n convergirá para algum valor limite constante que será o mesmo 
para cada possível sequência de repetições do experimento? Por exemplo, su- 
ponha que o experimento a ser realizado repetidamente consista em jogar uma 
moeda. Como saberemos que a proporção de caras obtidas nas n primeiras 
jogadas convergirá para algum valor à medida que n aumenta? Além disso, 
mesmo se essa proporção convergir para algum valor, como saberemos se, caso 
o experimento seja realizado uma segunda vez, obteremos a mesma proporção 
limite de caras? 

Proponentes da definição da probabilidade por meio da frequência relativa 
usualmente respondem a essa objeção dizendo que a convergência de n(E)/n 
para um valor limite constante é uma suposição, ou um axioma, do sistema. 
Entretanto, supor que n(E)/n necessariamente convergirá para algum valor 
constante parece ser uma suposição extraordinariamente complicada. Pois, 
embora realmente esperemos que tal frequência limite exista, não parece, a 
priori, de forma alguma evidente que este seja necessariamente o caso. De fato, 
não seria mais razoável supor um conjunto de axiomas simples e autoevidentes 
para a probabilidade e então provar que tal frequência limite constante exis- 
te de alguma maneira? Esta é a abordagem axiomática moderna da teoria da 
probabilidade que adotamos neste texto. Em particular, vamos assumir que, 
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para cada evento E no espaço amostral S, existe um valor P(E) chamado de 
probabilidade de E. Vamos então supor que todas as probabilidades satisfazem 
certo conjunto de axiomas, os quais, esperamos que o leitor concorde, estão de 
acordo com nossa noção intuitiva de probabilidade. 

Considere um experimento cujo espaço amostral é S. Para cada evento E 
do espaço amostral S, assumimos que um número P(E) seja definido e satisfaça 
os três axiomas a seguir: 


Axioma 1 
0=P(E)=1 
Axioma 2 
P(S)=1 
Axioma 3 


Para cada sequência de eventos mutuamente exclusivos E,, E,,... (isto é, 
eventos para os quais E,E, = (5 quando i = j), 


P E; -5 PE) 
i=1 


i=1 
Referimo-nos a P(E) como a probabilidade do evento E. 


Assim, o Axioma 1 diz que a probabilidade de o resultado do experimento 
ser o resultado de E é igual a algum número entre O e 1. O Axioma 2 diz, com 
probabilidade 1, que o resultado será um ponto contido no espaço amostral S. 
O Axioma 3 diz que, para qualquer sequência de eventos mutuamente exclusi- 
vos, a probabilidade de pelo menos um desses eventos ocorrer é justamente a 
soma de suas respectivas probabilidades. 

Se considerarmos a sequência de eventos E,, E,,...,onde E, = Se E, = () 


oo 
para i > 1, então, como os eventos são mutuamente exclusivos e S= U Ei, 
teremos, do Axioma 3, i=1 

oo oo 
PS) => PED=PS +, MD) 
i=1 i=2 
o que implica que 


PO) =0 


Isto é, o evento vazio tem probabilidade nula. 
Note que daí segue que, para qualquer sequência de eventos mutuamente 
exclusivos E,, E,,..., E,, 


P[UE|=5> PE (3.1) 
1 i=1 
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Essa equação pode ser obtida do Axioma 3 com a definição de E, como o 
evento vazio para todos os valores de i maiores que n. O Axioma 3 é equivalen- 
te à Equação (3.1) quando o espaço amostral é finito (por quê?). Entretanto, a 
generalidade do Axioma 3 é necessária quando o espaço amostral consiste em 
um número infinito de pontos. 


Exemplo 3a 


Se nosso experimento corresponde ao lançamento de uma moeda e se supomos 
que a probabilidade de dar cara é igual à de dar coroa, então temos 


1 
P4H) = PUT) = ) 


Por outro lado, se a moeda tivesse sido adulterada e identificássemos a sua 
probabilidade de dar cara como sendo duas vezes maior do que a de dar coroa, 
então teríamos 

1 


2 
PU) =5 MD=s a 


Exemplo 3b 


Se um dado é jogado e supormos que seus seis lados tenham a mesma proba- 
bilidade de aparecer, então teremos P((1]) = P((2)) = P((3)) = P((4)) = P((5)) 
= P((6)) = 1/6. Do Axioma 3, tem-se que a probabilidade de sair um número 
par é igual a 


P(2,4,6)) = PUB) + PU4) + PAG) = 5 o 
A suposição da existência de uma função conjunto P, que é definida 
para os eventos de um espaço amostral S e satisfaz aos Axiomas 1,2 e 3, 
constitui a abordagem matemática moderna para a teoria da probabilidade. 
Esperamos que o leitor concorde que os axiomas são naturais e que estão de 
acordo com o nosso conceito intuitivo de probabilidade, que está relaciona- 
do ao acaso e à aleatoriedade. Além disso, usando esses axiomas poderemos 
provar que, se um experimento é repetido várias vezes, então, com probabi- 
lidade 1,a proporção de tempo durante o qual qualquer evento E específico 
ocorre é igual a P(E). Esse resultado, conhecido como a lei forte dos grandes 
números, é apresentado no Capítulo 8. Além disso, apresentamos outra in- 
terpretação possível da probabilidade — como sendo uma medida de crença 
— na Seção 2.7. 


Observação técnica: Temos considerado P(E) como sendo definida 
para todos os eventos do espaço amostral. Na realidade, quando o espaço 
amostral é um conjunto infinito, P(E) é definida apenas para uma classe 
de eventos chamados mensuráveis. Entretanto, essa restrição, embora ne- 
cessária, não nos preocupa, já que todos os eventos com qualquer interesse 
prático são mensuráveis. 
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2.4 ALGUMAS PROPOSIÇÕES SIMPLES 


Nesta seção, provamos algumas proposições simples envolvendo probabilida- 
des. Primeiro notamos que, como E e E“ são sempre mutuamente exclusivos e 
como E U E = S, temos, pelos Axiomas 2 e 3, 


1=MA9)=PEU E)=P(E)+ PE) 
ou, equivalentemente, temos a Proposição 4.1. 


Proposição 4.1. 
P(E)=1 — P(E) 


Colocando em palavras, a Proposição 4.1 diz que a probabilidade de um 
evento não ocorrer é igual a 1 menos a probabilidade de ele ocorrer. Por exem- 
plo, se a probabilidade de dar cara ao lançar-se uma moeda é igual a 3/8, então 
a probabilidade de dar coroa deve ser igual a 5/8. 

Nossa segunda proposição diz que, se o evento E está contido no evento F, 
então a probabilidade de E não é maior que a probabilidade de F. 


Proposição 4.2. SeEC F,então P(E) = P(F). 
Demonstração Como E C F, podemos expressar F como 
F=EU EF 
Portanto, como E e E“F são mutuamente exclusivos, obtemos, do Axioma 3, 
P(F) = P(E) + P(E'F) 
o que prova o resultado, já que P(E'F) > 0. Im 


A Proposição 4.2 nos diz, por exemplo, que a probabilidade de sair 1 em 
um dado é menor do que a de sair um número ímpar. 

À próxima proposição fornece a relação entre a probabilidade da união de 
dois eventos, expressa em termos das probabilidades individuais e da probabi- 
lidade de interseção dos eventos. 


Proposição 4.3. 
PEUP=P(E + P(F) — P(EF) 
Demonstração Para deduzir uma fórmula para P(E U F), primeiro nota- 


mos que E U F pode ser escrito como a união dos dois eventos disjuntos E 
e E'F. Assim, do Axioma 3, obtemos 


PEUPMB=P(EU EF) 
= P(E) + P(ECF) 
Além disso, como F = EFU E'F, obtemos novamente do Axioma 3 
P(F) = P(EF) + P(ECF) 
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Figura 2.4 Diagrama de Venn. 


ou, equivalentemente, 
P(EF) = P(P) — P(EF) 


o que completa a demonstração. D 


A Proposição 4.3 também poderia ter sido provada por meio do diagrama 
de Venn da Figura 2.4. 

Vamos dividir E U F em três seções mutuamente exclusivas, conforme 
mostrado na Figura 2.5. Colocando em palavras, a seção I representa todos os 
pontos em E que não estão em F (isto é, EF”), a seção II representa todos os 
pontos simultaneamente em E e em F (isto é, EF) e a seção III representa todos 
os pontos em F que não estão em E (isto é, E'F). 

Da Figura 2.5, vemos que 


EUF=IUNUTI 
E=IUH 
F=HUN 
Como I, II e III são mutuamente exclusivos, tem-se do Axioma 3 que 
PEU F) = POD + POD + POI 
P(E) = P(D + POL 
P(P = PAD + POIS) 


o que mostra que 
PEUP=PE) + P(F) - PAI 


e com isso a Proposição 4.3 está provada, já que II = EF. 


? 


Figura 2.5 Diagrama de Venn em seções. 
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Exemplo 4a 


J. leva dois livros para ler durante as férias. A probabilidade de ela gostar do 
primeiro livro é de 0,5, de gostar do segundo livro é de 0,4 e de gostar de ambos 
os livros é de 0,3. Qual é a probabilidade de que ela não goste de nenhum dos 
livros? 


Solução Seja B, o evento “J. gosta do livro 1)i = 1,2. Então a probabilidade 
de J. gostar de pelo menos um dos livros é 
P(BUB)=P(B) + P(B;))-P(B,B,)) = 0,5 +04-0,3 = 0,6 


Como o evento “J. não gosta de nenhum dos livros” é o complemento do even- 
to em que ela gosta de pelo menos um deles, obtemos o resultado 


P(B;B5) = P((By U B9))=1 — P(B/U B9)=04 n 


Também podemos calcular a probabilidade de ocorrência de qualquer um 
dos três eventos E, Fe G, isto é, 


PEUFUG=PEUPUCG] 


que, pela Proposição 4.3, é igual a 
PEUF) + PG) — PE U F)6] 


Agora, resulta da lei distributiva que os eventos (E U F)Ge EGU FG são 
equivalentes; portanto, das equações anteriores, obtemos 
P(EUFUG) 
= P(E) + P(F) — P(EF) + P(G) — MEG U FG) 
= P(E) + P(F) — P(EF) + P(G) — P(EG) — P(FG) + P(EGFG) 
= P(E) + P(P) + P(G) — P(EF) — P(EG) — P(FG) + P(EFG) 


De fato, a proposição a seguir, conhecida como identidade da inclusão-exclusão, 
pode ser demonstrada por indução matemática: 


Proposição 4.4. 


n 
PE UE U--U En) = >, P(E)) = >, P(E; Ep) +. 
i=1 h<iz 
+ SO PB,E--Ei) 
<ip<<ip 


+ + (DP(EE)-.- En) 


Asoma 5) PE,E,:-- Ei)é feita ao longo de todos os ( ” ) subconjun- 
i<iy<-<ip 
tos possíveis de tamanho r do conjunto (1,2....,n). 


Colocando em palavras, a Proposição 4.4 diz que a probabilidade da união 
de n eventos é igual à soma das probabilidades individuais desses eventos, me- 
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nos a soma das probabilidades desses eventos dois a dois, mais a soma das pro- 
babilidades desses eventos três a três, e assim por diante. 


Observações: 1. Para uma demonstração não indutiva da Proposição 
4.4, note primeiro que se o resultado de um espaço amostral não pertencer a 
nenhum dos conjuntos E, então sua probabilidade não contribuirá de forma 
alguma para nenhum dos lados da igualdade. Agora, suponha que um resulta- 
do apareça em exatamente m dos eventos E, onde m > 0. Então, como o re- 


sultado aparece em [J E;, sua probabilidade é contada uma vez em P | JE;|; 


L L 
além disso, como esse resultado está contido em ( k ) subconjuntos do tipo 
Ei, Ei, - - * Ei, sua probabilidade é contada 


m m m m 
ee) so) 
vezes no lado direito do sinal de igualdade da Proposição 4.4. Assim, para m > 
0, devemos mostrar que 


=()-(5) (8) -=(8) 


Entretanto, como 1 = ( pá > a equação anterior é equivalente a 


E(r)ent=o 


i=0 


1 


e a última equação é consequência do teorema binomial, já que 
m 
fio m — MA nin 
0=(1+1) RA ; )« Da) 


i=0 


2. A equação a seguir é uma forma sucinta de se escrever a identidade da 
inclusão-exclusão: 


PUB E)=> (Do PE-E) 


r=1 j<-<ir 


3. Na identidade da inclusão-exclusão, a saída de um termo resulta em um 
limite superior para a probabilidade da união, a saída de dois termos resulta em 
um limite inferior para a probabilidade, a saída de três termos resulta em um 
limite superior para a probabilidade, a saída de quatro termos resulta em um 
limite inferior, e assim por diante. Isto é, para eventos E,...., E,, temos 


P(UL,E) = P(E) (4.1) 
i=1 


PULE) = > PED — > PESE) o) 


i=1 j<i 
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n 
PUL,E) <> PE) -— S PEE)+ > PEEE) (43) 
i=1 j<i k<j<i 
e assim por diante. Para provar a validade desses limites, note a identidade 
UE; =EU E(E, U Ei E5E3 UU E . Ei En 
Isto é, pelo menos um dos eventos E, ocorre se E, ocorrer, ou se E, não ocorrer 


mas E, ocorrer, ou se E, e E, não ocorrerem mas E, ocorrer, e assim por diante. 
Como o lado direito é a união de eventos disjuntos, obtemos 


P(UL, ED) = P(E1) + PCESE)) + P(ESESES) +... + P(ES ES En) 


= P(E1) + > P(ES--- Ef E) (4.4) 
i=2 


Agora, seja B; = E, - e E; 4 = (U;<:E;)º o evento em que nenhum dos primei- 


ros i— 1 eventos ocorrem. A aplicação da identidade 
P(E)) = P(B;E;) + P(B;E;) 
mostra que 
P(E; = PE, --- E; Ei) + PE; Ujoi E; 
ou, equivalentemente, 
P(E; --- E; Ei) = P(Ej) — P(UjaE:E, 
A substituição dessa equação em (4.4) resulta em 


P(UL,E) => P(E) — > PU«EE) (4.5) 


Como probabilidades são sempre não negativas, a Desigualdade (4.1) resulta 
diretamente da Equação (4.5). Agora, fixando i e aplicando a Desigualdade 
(4.1) em P(U,.,E,E,), obtém-se 
PU aE;E;) < > PBE) 
j<i 
que, pela Equação (4.5), fornece a Desigualdade (4.2). Similarmente, fixando i 
e aplicando a Desigualdade (4.2) em P(U;.,E,E,), obtém-se 


P(UckiE;) = > PCB) — er P(E;E;E;Ek) 


j<i k<j<i 
= SS PEE) — oo P(E;E;Ek) 
j<i k<j<i 


que, pela Equação (4.5), fornece a Desigualdade (4.3). A próxima desigualdade 
inclusão-exclusão pode agora ser obtida fixando-se i e aplicando-se a Desigual- 
dade (4.3) a P(U,..E,E), e assim por diante. 


52 Probabilidade: Um Curso Moderno com Aplicações 


2.5 ESPAÇOS AMOSTRAIS COM RESULTADOS 
IGUALMENTE PROVÁVEIS 


Em muitos experimentos, é natural supor que todos os resultados presentes no 
espaço amostral sejam igualmente prováveis. Por exemplo, considere um expe- 
rimento cujo espaço amostral S é um conjunto finito, digamos, S = (1,2,..., N). 
Nesse caso, é muitas vezes natural supor que 


PQ) = P(2)) =... = PQNH 


O que implica, dos Axiomas 2 e 3 (por quê?), que 
1 
PMi) = N i=1,2,...,N 


Dessa equação, resulta do Axioma 3 que, para cada evento E, 


PB) = número de resultados em E 


número de resultados em $ 


Colocando em palavras, se supomos que todos os resultados de um experimen- 
to são igualmente prováveis, então a probabilidade de qualquer evento E é 
igual à proporção de resultados no espaço amostral que estão contidos em E. 


Exemplo 5a 


Se dois dados são lançados, qual é a probabilidade de que a soma das faces de 
cima seja igual a 7? 


Solução Vamos resolver este problema supondo que todos os 36 resultados 
possíveis sejam igualmente prováveis. Como há 6 resultados possíveis — isto é, 
(1, 6), (2,5), (3, 4), (4,3), (5,2) e (6, 1) — que resultam na soma dos dados ser 
igual a 7 a probabilidade desejada é igual a É = & [n 


Exemplo 5b 


Se três bolas são “retiradas aleatoriamente” de um recipiente contendo 6 bolas 
brancas e 5 bolas pretas, qual é a probabilidade de que uma das bolas seja bran- 
ca e as outras duas sejam pretas? 


Solução Se considerarmos a ordem de seleção das bolas como sendo rele- 
vante, então o espaço amostral é formado por 11 - 10 - 9 = 990 resultados. 
Além disso, existem 6 : 5 - 4 = 120 resultados nos quais a primeira bola selecio- 
nada é branca e as outras duas são pretas; 5 - 6 - 4 = 120 resultados nos quais a 
primeira bola é preta, a segunda é branca e a terceira é preta;e 5 - 4: 6 = 120 
resultados nos quais as primeiras duas bolas são pretas e a terceira é branca. 
Portanto, supondo que “retiradas aleatoriamente” signifique que cada evento 
do espaço amostral seja igualmente provável, vemos que a probabilidade de- 
sejada é igual a 
120 + 120 + 120 4 
990 uu 
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Este problema também poderia ter sido resolvido considerando-se o resultado 
do experimento como sendo o conjunto desordenado de bolas retiradas. Por este 


E 11 
ponto de vista, existem ( 3 ) = 165 resultados no espaço amostral. Nesse caso, 


cada conjunto de 3 bolas corresponde a 3! resultados quando a ordem da seleção 
é levada em consideração. Como consequência, se for considerado que todos os 
resultados são igualmente prováveis quando a ordem da seleção é importante, 
tem-se que estes continuam igualmente prováveis quando o resultado considera- 
do é um conjunto desordenado de bolas selecionadas. Dessa forma, usando esta 
última representação do experimento, vemos que a probabilidade desejada é 


(6) a 


1 uu 
(5) 
o que, naturalmente, concorda com a resposta obtida previamente. 

Quando o experimento consiste em uma seleção aleatória de k itens de um 
conjunto de n itens, temos a flexibilidade de deixar que o resultado do experi- 
mento seja a seleção ordenada dos k itens ou que seja o conjunto desordenado 
de itens selecionados. No primeiro caso, suporíamos que cada nova seleção te- 
ria probabilidade igual à de todos os itens ainda não selecionados do conjunto, 
e no último caso suporíamos que todos os (4) subconjuntos possíveis de k itens 
teriam a mesma probabilidade de serem selecionados. Por exemplo, suponha 
que 5 pessoas devam ser selecionadas aleatoriamente de um grupo de 20 indiví- 
duos formados por 10 casais, e que queiramos determinar P(N), a probabilida- 
de de que os 5 escolhidos não estejam relacionados (isto é, que nenhum par de 
pessoas selecionadas seja um casal). Se considerarmos o espaço amostral como 
sendo o conjunto de 5 pessoas escolhidas, então há E) resultados igualmente 
prováveis. Um resultado que não contém um casal pode ser pensado como a 
saída de um experimento de seis estágios: no primeiro estágio, 5 dos 10 casais 
que terão um membro no grupo são escolhidos; nos 5 estágios seguintes, sele- 
ciona-se 1 dos 2 membros de cada um desses casais. Assim, há (ea resultados 
possíveis nos quais os 5 membros selecionados não estão relacionados, o que 
leva à probabilidade desejada de 


Em contraste, poderíamos considerar o resultado do experimento como sen- 
do a seleção ordenada dos 5 indivíduos. Neste caso, haveria 20 - 19 - 18: 17 16 
resultados igualmente prováveis, dos quais 20 - 18 - 16 - 14 - 12 casos resultariam 
em um grupo de 5 indivíduos não relacionados. Como resultado, teríamos 


20 . 18. 16.14.12 


P(N) = 
E 20 . 19.18.17. 16 
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Deixamos para o leitor a verificação de que as duas respostas são idênticas. E 


Exemplo 5c 


Um comitê de 5 pessoas deve ser selecionado de um grupo de 6 homens e 9 
mulheres. Se a seleção for feita aleatoriamente, qual é a probabilidade de que o 
comitê seja formado por 3 homens e 2 mulheres? 


Solução Como cada um dos (5) comitês possíveis tem a mesma probabilida- 


de de ser selecionado, a probabilidade desejada é 


15 — 1001 
5 
Exemplo 5d 


Uma urna contém n bolas, uma das quais é especial. Se k dessas bolas são reti- 
radas uma de cada vez, e se todas as bolas na urna têm a mesma a probabilida- 
de de serem retiradas, qual é a probabilidade de a bola especial ser escolhida? 


Solução Como todas as bolas são tratadas da mesma maneira, tem-se que 


o conjunto de k bolas pode ser qualquer um dos ( É ) conjuntos de k bolas. 


Portanto, 
1 n-—-1 
1 k — 1 k 


Pfseleção de bola especial) = + = 


Também poderíamos ter obtido esse resultado fazendo com que 4, denotasse o 
evento em que a bola especial é a i-ésima bola a ser escolhida, i = 1,..., k. Então, 
como cada uma das n bolas teria a mesma probabilidade de ser a i-ésima bola 
escolhida, obteríamos P(A,) = 1/n. Como esses eventos são claramente mutua- 
mente exclusivos, temos 


k k 

; k 

Píseleção de bola especial) = P [o 4) — 3 P(A) = : 
I= = 


Também poderíamos ter mostrado que P(A;) = 1/n notando que há n(n — 1)... 
(n—k + 1) = n!/(n — k)! resultados igualmente prováveis no experimento, dos 
quais (n = D(n-2)...(n-i+ D)D(n-)...(n-k+D) = (n-Dl/(n-k)! cul- 
minam na escolha da i-ésima bola como sendo a bola especial. Seguindo esse 
raciocínio, tem-se que 

n—-D! 1 


PES o " 
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Exemplo 5e 


Suponha que n + m bolas, das quais n são vermelhas e m são azuis, sejam arran- 
jadas em uma sequência linear de forma que todas as (n + m)! sequências pos- 
síveis sejam igualmente prováveis. Se gravarmos o resultado deste experimento 
listando apenas as cores das bolas sucessivas, mostre que todos os resultados 
possíveis permanecem igualmente prováveis. 


Solução Considere qualquer uma das (n + m)! sequências possíveis e note 
que qualquer permutação das bolas vermelhas entre si e das bolas azuis entre 
si não muda a sequência das cores. Como resultado, cada sequência de cores 
corresponde a n!m! diferentes sequências das n + m bolas, de forma que cada 
sequência de cores tem probabilidade de ocorrência igual a nlm!/(n + m)!. 

Por exemplo, suponha que há 2 bolas vermelhas, numeradas como v,, v,,€ 2 
bolas azuis, numeradas como a,, a,. Então, das quatro possíveis sequências, 2! 2! 
delas resultarão em qualquer combinação de cores especificada. Por exemplo, 
as ordenações a seguir resultam na alternância de cores em bolas adjacentes, 
com uma bola vermelha na frente: 


VA VA, Volvo VoApVpO VoQVA 


Portanto, cada uma das possíveis sequências de cores tem probabilidade 5 — E 
de ocorrer. E 


Exemplo 5f 


Uma mão de pôquer consiste em 5 cartas. Se as cartas tiverem valores conse- 
cutivos distintos e não forem todas do mesmo naipe, dizemos que a mão é um 
straight. Por exemplo, uma mão com cinco de espadas, seis de espadas, sete de 
espadas, oito de espadas e nove de copas é um straight. Qual é a probabilidade 
de que alguém saia com um straight? 


Solução Começamos supondo que todas as ( ) mãos de pôquer possíveis 


sejam igualmente prováveis. Para determinar o número de eventos que corres- 
pondem a um straight, vamos primeiro determinar o número de resultados nos 
quais a mão de pôquer é formada por um ás, um dois, um três, um quatro e um 
cinco (com os naipes irrelevantes). Como o ás pode ser qualquer um dos ases 
possíveis, o mesmo ocorrendo com o dois, o três, o quatro e o cinco, existem 4 
eventos que levam exatamente a uma sequência como essa. Como em 4 desses 
eventos todas a cartas possuirão o mesmo naipe (tal mão é chamada de flush), 
conclui-se que existem 4º — 4 mãos que resultam em um straight na forma de 
ás, dois, três, quatro e cinco. Similarmente, há 4º - 4 mãos que resultam em um 
straight na forma de dez, valete, dama, rei e ás. Assim, há 10(4º — 4) mãos que 
são straights, e, como consequência, a probabilidade desejada é 


10(4º — 4) 


(5) 


= 0,0039 = 
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Exemplo 5g 


Numa mão de pôquer de cinco cartas, o full house ocorre quando alguém sai 
com três cartas de mesmo valor e duas outras cartas de mesmo valor (que 
é naturalmente diferente do primeiro). Assim, um full house é formado por 
uma trinca mais um par. Qual é a probabilidade de alguém sair com um full 
house? 


5 521). a duo. ER 
Solução Novamente, supomos que todas as s | mãos possíveis têm a mes- 
ma probabilidade de ocorrer. Para determinar o número de full houses, pri- 
. (4 4 sora o an ; 
meiramente notamos que há 2 3 combinações diferentes de, digamos, 


2 setes e 3 valetes. Como existem 13 diferentes escolhas para o valor do par 
e, após a escolha do par, 12 outras escolhas para o valor das 3 cartas restantes, 
tem-se que a probabilidade de um full house é 


4/4 
a 0,0014 


Exemplo 5h 
No jogo de bridge, o baralho de 52 cartas é inteiramente distribuído entre 4 
jogadores. Qual é a probabilidade de 


(a) um dos jogadores receber tódas as treze cartas do naipe de espadas? 
(b) cada jogador receber um ás? 


Solução (a) Chamando de E, o evento em que a mão i tem todas as cartas de 
espadas, então 


P(Ei;) = i=1,2,3,4 


52 * 
13 


Como os eventos E, i = 1,2,3,4, são mutuamente exclusivos, a 
probabilidade de uma mão sair com todas as cartas de espadas é . 


4 
52 o 
PU4E) = PED =4/ Co x 6,3 x 10-22 


(b) Para determinar o número de eventos nos quais cada um dos 
jogadores pode receber exatamente um ás, deixe os ases de lado 


e observe que há 12,12,12,12 divisões possíveis das outras 
48 cartas quando cada jogador receber 12 delas. Como há 4! ma- 


neiras de dividir os quatro ases de forma que cada um receba um 
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deles, vemos que o número de eventos possíveis nos quais cada 


E ; 48 
He | 
jogador recebe exatamente um ás é igual a 4! 12,12,12,12 )- 


E 2 o aos ais 
Como existem (13131313) mãos possíveis, a probabilidade de- 
sejada é então 


4 (12121219) 


> ) = 0,1055 a 
13,13,13,13 


Alguns resultados em probabilidade são bastante surpreendentes. Os pró- 
ximos dois exemplos ilustram esse fenômeno. 


Exemplo 5i 


Se n pessoas se encontram no interior de uma sala, qual é a probabilidade de 
que duas pessoas não celebrem aniversário no mesmo dia do ano? Quão gran- 
de precisa ser n para que essa probabilidade seja menor que 1/2? 


Solução Como cada pessoa pode celebrar seu aniversário em qualquer um 
dos 365 dias, há um total de (365)” resultados possíveis (ignoramos aqui a pos- 
sibilidade de alguém ter nascido no dia 29 de fevereiro). Supondo que cada 
resultado seja igualmente provável, vemos que a probabilidade desejada é igual 
a (365)(364)(363)... (365 —n +1)/ = (365)”. É bastante surpreendente o fato de 
que quando n = 23, essa probabilidade é menor que 1/2. Isto é, se há 23 pessoas 
ou mais em uma sala, então a probabilidade de que pelo menos duas delas fa- 
çam aniversário no mesmo dia é maior que 1/2. Muitas pessoas inicialmente se 
surpreendem com esse resultado, pois 23 parece ser muito pequeno em relação 
a 365, o número de dias em um ano. Entretanto, cada par de indivíduos tem 


3 1 
probabilidade ESSO = 365 de fazer aniversário no mesmo dia, e em um grupo 


de 23 pessoas existem ( ) = 253 diferentes pares de indivíduos. Visto dessa 


maneira, o resultado deixa de ser tão surpreendente. 

Quando há 50 pessoas na sala, a probabilidade de que pelo menos dois 
tenham nascido no mesmo dia é de aproximadamente 0,970, e, com 100 pes- 
soas na sala, as chances são maiores que 3.000.000:1 (isto é, a probabilidade é 


maior que 3 x 10º de que pelo menos duas pessoas façam aniversário no 
SC ad é 

mesmo dia). D 

Exemplo 5j 


Um baralho de 52 cartas é embaralhado e as cartas são viradas uma de cada vez 
até que o primeiro ás apareça. E mais provável que a próxima carta — isto é, a 
carta retirada logo após o primeiro ás — seja o ás de espadas ou o dois de paus? 


Solução Para determinar a probabilidade de que a carta retirada após o pri- 
meiro ás seja o ás de espadas, precisamos calcular quantas das (52)! possíveis 
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sequências de cartas apresentam o ás de espadas sucedendo imediatamente o 
primeiro ás. Para começar, note que cada sequência de 52 cartas pode ser obtida 
inicialmente ordenando-se as 51 cartas sem o ás de espadas e depois inserindo- 
se o ás de espadas. Além disso, para cada uma das (51)! sequências das outras 
cartas, existe apenas um lugar onde o ás de espadas pode ser colocado para que 
ele saia logo após o primeiro ás. Por exemplo, se a sequência das 51 cartas for 


4p,6c,Jo,5e, Ap, 70,...,Kc 


então a única inserção do ás de espadas que resulta em seu aparecimento logo 
após o primeiro ás é 


4p,6c, Jo, 5e, Ap, Ae, 70,...,Kc 


Portanto, existem (51)! sequências que resultam no aparecimento do ás de es- 
padas logo após o primeiro ás. Com isso, 


GD! 1 


P(ás de espadas vir logo após o primeiro ás) = (DT 3 


De fato, usando exatamente o mesmo argumento, tem-se que a probabilidade 
de que o dois de paus (ou qualquer outra carta específica) venha logo após o 
primeiro ás também é de 1/52. Em outras palavras, cada uma das 52 cartas do 
baralho tem probabilidade igual de sair logo após o primeiro ás! 

Muitas pessoas consideram esse resultado bastante surpreendente. Real- 
mente, é uma reação comum supor de início que o dois de paus tenha uma 
maior probabilidade de sair logo após o primeiro ás (em vez do ás de espadas), 
já que o primeiro ás poderia ser ele próprio o ás de espadas. Essa reação é 
frequentemente seguida da percepção de que o dois de paus também poderia 
aparecer antes do primeiro ás, o que cancelaria a chance de ele sair logo após o 
primeiro ás. Entretanto, como há uma chance em quatro de que o ás de espadas 
seja o primeiro ás (pois os 4 ases têm a mesma probabilidade de aparecer pri- 
meiro) e uma chance em cinco de que o dois de paus apareça antes do primeiro 
ás (porque cada um dos conjuntos de 5 cartas formados pelo dois de paus e os 4 
ases tem a mesma probabilidade de ser o primeiro no conjunto a aparecer), no- 
vamente parece que a probabilidade de o dois de paus sair é maior. Entretanto, 
não é este o caso, e uma análise mais completa mostra que a probabilidade é 
realmente a mesma. a 


Exemplo 5k 


Um time de futebol americano é formado por 20 atacantes e 20 defensores. 
Os jogadores devem formar pares com o propósito de definir aqueles que vão 
dividir o mesmo quarto. Se a formação dos pares é feita de forma aleatória, 
qual é a probabilidade de que um atacante e um defensor não sejam colegas de 
quarto? Qual é a probabilidade de haver 2i pares de atacantes e defensores em 
um mesmo quarto, com i = 1,2,...,10? 
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Solução Existem 
40 No (go)! 
Dido Do ADA2O 
maneiras de dividir os 40 jogadores em 20 pares ordenados (isto é, há (40)!/2”” 
maneiras de dividir os jogadores em um primeiro par, um segundo par, e as- 
sim por diante). Portanto, há (40)!/2(20)! maneiras de dividir os jogadores em 
pares desordenados. Além disso, como a divisão resultará em pares que não 
são formados por um atacante e um defensor caso os atacantes (e defensores) 
formem pares entre si, tem-se que existem [(20)!/2"(10)!]º divisões como essa. 


Portanto, a probabilidade de que um atacante e um defensor não sejam colegas 
de quarto, chamada de P,, é dada por 


(20)! 
(am — Too!f 


CC do [ao!p(ao)! 
220(20)! 


Para determinar P,, a probabilidade de formar 2i pares de atacantes e defenso- 
Race : 20 : 
res em um mesmo quarto, primeiro notamos que existem | ». | maneiras de 
selecionar os 2i atacantes e os 2i defensores que devem formar os pares. Esses 
4i jogadores podem então ser organizados em (2i)! possíveis pares de defen- 
sores e atacantes (isso ocorre porque o primeiro atacante pode formar um par 
com qualquer um dos 2i defensores, o segundo atacante pode formar um par 
com qualquer um dos 2i — 1 defensores restantes, e assim por diante). Como os 
20 — 2i atacantes (e defensores) restantes devem formar pares entre si, existem 


20) | Q0-2! 7º 
(5) cole =| 


divisões que levam a 2i pares com um atacante e um defensor. Portanto, 


2 - 2 
(5) CO [sigo fria | 
BN 210-i(10 — 5)! RE 
E fi (40)! o pasa a nd e na) 


220(20)! 


A probabilidade P,, i = 0,1.,..., 10 pode agora ser computada ou aproximada 
com o emprego de um resultado obtido por Stirling que mostra que n! é apro- 
ximadamente igual a nº+1/2e-" /27. Por exemplo, obtemos 

Po = 1,3403 x 106 

Pio = 0,345861 

Po = 7,6068 X 104 n 
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Nossos próximos três exemplos ilustram a utilidade da Proposição 4.4. No 
Exemplo 51, o emprego da teoria da probabilidade permite a obtenção de uma 
resposta rápida para um problema de contagem. 


Exemplo 51 


Um total de 36 sócios de um clube joga tênis, 28 jogam squash e 18 jogam boli- 
che. Além disso, 22 dos sócios jogam tênis e squash, 12 jogam tênis e boliche, 9 
jogam squash e boliche, e 4 jogam todos os três esportes. Quantos sócios desse 
clube jogam pelo menos um dos três esportes? 


Solução Seja N o número de sócios do clube. Vamos utilizar os conceitos de 
probabilidade supondo que um sócio do clube seja selecionado aleatoriamente. 
Se, para qualquer subconjunto € formado por sócios do clube, fizermos com 
que P(C) caracterize a probabilidade de que o sócio-selecionado esteja contido 
em C, então 


número de sócios em €C 


P(O = N 


Agora, sendo T o número de sócios que jogam tênis, S o número de sócios que 
jogam squash e B o número de sócios que jogam boliche, temos, da Proposição 
4.4 
P(TUSUB) 
=PMT) + PS + PB) — PTS) — PTB) — P(SB) + P(TSB) 
.36+28+18-2 —-12-9+4 


N 
Ea 


N 
Com isso, podemos concluir que 43 sócios jogam pelo menos um dos esportes. O 


O próximo exemplo desta seção possui não apenas a virtude de dar origem a 
uma resposta relativamente surpreendente; ele também é de interesse teórico. 


Exemplo 5m O problema do pareamento 


Suponha que cada um dos N homens presentes em uma festa atire seu chapéu 
para o centro da sala. Os chapéus são primeiramente misturados, e então cada 
homem seleciona aleatoriamente um deles. Qual é a probabilidade de que ne- 
nhum dos homens selecione o seu próprio chapéu? 


Solução Primeiro calculamos a probabilidade complementar de pelo menos 
um homem selecionar o seu próprio chapéu. Chamemos de E,,i = 1,2,..,N o 
evento em que o i-ésimo homem seleciona seu próprio chapéu. Agora, pela 
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i= 


N 
Proposição 4.4, P (O 6) ,a probabilidade de que pelo menos um dos homens 


selecione o seu próprio chapéu é dada por 


N N 
PUJE|=D PED —- 5 PEsEp + 
i=1 i=1 i<iz 
+ CDU SO PE Ei) 
is<io--<in 


+ + (DM PE, --- En) 


Se interpretarmos o resultado desse experimento como um vetor de N núme- 
ros, onde o i-ésimo elemento corresponde ao número do chapéu jogado pelo 
i-ésimo homem, então existem N! resultados possíveis [o resultado (1, 2, 3...., 
N) significa, por exemplo, que cada homem selecionou o seu próprio chapéu]. 
Além disso, E, E,... E, O evento em que cada um dos n homens i,, i,,..., i, sele- 
ciona o seu próprio chapéu pode ocorrer de qualquer uma das (N - n)(N — n 
-1)...3-2:1= (N-n)! maneiras possíveis; pois, dos N — n homens restantes, 
o primeiro pode selecionar qualquer um dos N —n chapéus, o segundo pode se- 
lecionar qualquer um dos N—n — 1 chapéus, e assim por diante. Assim, supondo 
que todos os N! resultados possíveis sejam igualmente prováveis, vemos que 


(N — n)! 


PEEcE)=A 
Além disso, como existem ( E )termos em 5 PE, E;::- Ei) tem-se que 
W<iz:<in 
NHN — n)! 1 


2(N- mlniN!O n! 


> PEnEp: Es) 


i<iz:-<in 


Logo, 
N 
l l nt À 
(Un) = e 


Portanto, a probabilidade de que nenhum dos homens selecione seu próprio 
chapéu é 


1145540 + 


que é aproximadamente igual a é! = 0,36788 para N grande. Em outras pala- 
vras, para N grande, a probabilidade de que nenhum dos homens selecione o 
seu próprio chapéu é de aproximadamente 0,37 (quantos leitores pensaram 
incorretamente que essa probabilidade tenderia a 1 à medida que N07). EE 
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Para mais uma ilustração da utilidade da Proposição 4.4, considere o exem- 
plo a seguir. 


Exemplo 5n 


Compute a probabilidade de que, com 10 casais sentados de forma aleatória em 
uma mesa redonda, nenhuma mulher se sente ao lado de seu marido. 


Solução Se E,i = 1,2,..., 10 caracterizar o evento em que o i-ésimo casal se 


10 
senta junto, então a probabilidade desejada éigualal — P| UU E;|.Agora, da 
Proposição 4.4, gi 


10 
P(UE; ra + (Ot SO PE,E, E) 
1 i<ip<-<in 


ones POE BS +» Ey) 


Para computar P(E; Ei; - - - Ei,), primeiro notamos que existem 19! maneiras 
de arranjar 20 pessoas sentadas em uma mesa redonda (por quê?). O número 
de arranjos que resultam em um conjunto específico de n homens sentados ao 
lado de suas esposas pode ser obtido mais facilmente se pensarmos primei- 
ramente em cada um dos n casais como sendo entidades únicas. Se este fosse 
o caso, então precisaríamos arranjar 20 — n entidades em torno de uma mesa 
redonda, e existiriam claramente (20 -n — 1)! arranjos como esse. Finalmente, 
como cada um dos n casais pode ser arranjado ao lado do outro em uma de 
duas possíveis maneiras, existem portanto 2"(20 — n — 1)! arranjos que resul- 
tam em um conjunto específico de n homens sentados ao lado de suas esposas. 
Portanto, 


2"(19 — n)! 


P(En Ei Ei) = om 


Assim, da Proposição 4.4, obtemos que a probabilidade de pelo menos um ca- 
sal sentar-se junto é igual a 


10,1 (18)! (5) 2 (17! É 3 (16)! o) 10 9! 
2 ——— — 22—— pa Ca = 0,6605 
( 1 ) (19)! 2 (19)! tia (19)! 10 )2 ant o 
e a probabilidade desejada é igual a 0,3395. o 


*Exemplo 5o Séries 


Considere um time de atletismo que terminou a temporada com uma campa- 
nha de n vitórias e m derrotas. Examinando as sequências de vitórias e derrotas, 
esperamos determinar se o time teve disputas nas quais seria mais provável que 
ele vencesse. Uma maneira de analisar essa questão em maior profundidade é 
contar o número de séries de vitórias e então ver quão provável esse resultado 
seria se supuséssemos que todas as (n + m)!(n!m!) ordenações das n vitórias 
e m derrotas fossem igualmente prováveis. Como série de vitórias, queremos 
dizer uma seguência consecutiva de vitórias. Por exemplo, sen = 10,m = 6e a 
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sequência de resultados fosse VVDDVVVDVDDDVVVYV, então haveria qua- 
tro séries de vitórias — a primeira delas de tamanho 2, a segunda de tamanho 3, 
a terceira de tamanho 1 e a quarta de tamanho 4. 

Suponha agora que um time tenha n vitórias e m derrotas. Supondo que 


n+m 


todas as (n! m!) = ordenações sejam igualmente prováveis, vamos 


determinar a probabilidade de que existam exatamente r séries de vitórias. 
Para fazer isso, considere primeiro qualquer vetor de inteiros positivos x,, x,,..., 
x, com x, +... + x, = n, e então vejamos quantos resultados levam a r séries 
de vitórias nas quais a i-ésima série tem tamanho x, i = 1,...,r. Para qualquer 
resultado como esse, se fizermos com que y, caracterize o número de derrotas 
anteriores à primeira série de vitórias, y, o número de derrotas entre as 2 pri- 
meiras séries de vitórias,..., y,,, O número de derrotas após a última série de 
vitórias, então y, satisfaz 


yrity + tymya=m »=20y4,1=20,y;>0i=2,...,r 


e o resultado pode ser representado esquematicamente como 


DD...DVV..V D...DVV..V ... VV D...D 
L— O No Saes qem! 
xi x1 y2 x2 XY 


Portanto, o número de resultados que levam a r séries de vitórias — a i-ésima 
delas com tamanho x, i = 1,...,r — é igual ao número de inteiros y,,...; ),,| que 
satisfazem a equação anterior, ou, de forma equivalente, ao número de inteiros 
positivos 


H=n +41 W=Yi=2..615)n=In +1 
que satisfazem 
FPI e IS o 2 
Pela Proposição 6.1 do Capítulo 1, existem ( dj E : ) resultados como esse. 
Com isso, o número total de resultados que levam a 7 séries de vitórias é igual a 
( fi E É ). muttiplicado pelo número de soluções integrais de x, +... + x, = n. 


Assim, novamente da Proposição 6.1, existem ( ni a ! ) ( É a ; ) resultados 


pe oh Gegi : n+m . 
levando a r séries de vitórias. Como existem ( : ) resultados igualmente 
prováveis, tem-se como consequência que 


m+1 n-—1 
r r—1 
mn 
n 
Por exemplo, sen = 8e m = 6, então a probabilidade de 7 séries de vitórias é 


igual a( ; ) ( ú ) / ( A ) = 1/429se todos os( E: ) resultados forem igual- 


P((r séries de vitórias)) = rz1 
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mente prováveis. Portanto, se o resultado tivesse sido VDVDVDVDVVDVDYV, 
então poderíamos suspeitar que a probabilidade de vitória do time estivesse 
mudando ao longo do tempo (em particular, a probabilidade de que o time 
vença parece ser bastante alta quanto ele perde o último jogo e bastante bai- 
xa quando ele ganha o último jogo). No outro extremo, se o resultado tivesse 


sido VVVVVVVVDDDDDD, então teria havido apenas uma série de vitórias, 
e como P((1 série) = ( : ) ( : ) j ( ) = 1/429, pareceria-nos novamente 


improvável que a probabilidade do time vencer tivesse permanecido a mesma 
durante seus 14 jogos. m 


*2.6 PROBABILIDADE COMO UMA FUNÇÃO 
CONTINUA DE UM CONJUNTO 


Uma sequência de eventos [E,,n > 1] é chamada de sequência crescente se 


EC EEE CE E 


n+1 


e é chamada de sequência decrescente se 


EEE DES 


n+1 


Se [E,,n = 1) é uma sequência crescente de eventos, então definimos um novo 
evento, representado por lim E,, como 
nR—00 


[9,6] 
de o 
i= 


Similarmente, se [£,,n = 1) é uma sequência decrescente de eventos, definimos 
lim E, como 
n 


[6.6] 
lim E, = Q E, 
n—00 
i=1 
Demonstramos agora a proposição a seguir: 


Proposição 6.1. 
Se [E,,n = 1) é uma sequência crescente ou decrescente de eventos, então 


im PE) = Pim, Em 


Demonstração Suponha, primeiro, que (E,,n = 1] seja uma sequência 
crescente, e defina os eventos F,,n = 1, como 


F; = Ei 
n-1 lá 
Fa = E, EJE Bis ted 
1 
n-1 


onde usamos o fato de que UU E; = E,-1, pois os eventos são crescentes. Co- 


1 
locando em palavras, F, corresponde aos resultados de É, que não estão em 
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nenhum dos eventos E, anteriores, i < n. É fácil verificar que F, são eventos 
mutuamente exclusivos, tais que 


00 oo n n 
Ur=UJE e UJa=lJz para todo n = 1 
i=1 i=1 i=1 i=1 


Assim, 


[0,6] [0,0] 
PÃUE|=P|lUR 
1 1 


Il 


[0,0] 
> P(F) (pelo Axioma 3) 
d 


n 
q » PB) 


n 
dim P U F; 


n 


do PlEn) 


I| 


o que prova o resultado quando (E,,n = 1) é crescente. 


Se [E,,n > 1) é uma sequência decrescente, então (E,,n = 1) é uma sequên- 
cia crescente; portanto, das equações anteriores, 


P (O n) = lim PES 


1 


c 
(0,0) 00 
Entretanto, como UJ Ef = (5 E) , tem-se que 
1 1 


c 
oo 
P (n s) = lim P(E, 
ou, de forma equivalente, 


1-P [A e) = lim [1 —- PED]=1 — lim P(En) 
1 
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ou 


oo 
P NE = lim P(En) 
1 


o que demonstra o resultado. Im 


Exemplo 6a Probabilidade e um paradoxo 


Suponha que possuamos uma urna infinitamente grande e uma coleção infini- 
ta de bolas marcadas com os números 1, 2,3, e assim por diante. Considere um 
experimento realizado como se segue: um minuto antes do meio-dia, as bolas 
numeradas de 1 a 10 são colocadas na urna e a bola número 10 é sacada (su- 
ponha que a retirada seja feita de forma instantânea). Meio minuto antes do 
meio-dia, as bolas 11 a 20 são colocadas na urna e a bola número 20 é retirada. 
Um quarto de minuto antes do meio-dia, as bolas 21 a 30 são colocadas na 
urna e a bola número 30 é sacada. Um oitavo de minuto antes do meio dia..., 
e assim por diante. A questão de interesse é: quantas bolas estão na urna ao 
meio-dia? 

A resposta para essa questão é claramente que existe um número infinito 
de bolas na urna ao meio-dia, já que qualquer bola cujo número não seja da 
forma 10n,n = 1, terá sido colocada na urna e não terá sido retirada antes do 
meio-dia. Portanto, o problema é resolvido quando o experimento é realizado 
conforme descrito. 

Entretanto, vamos agora mudar o experimento e supor que um minuto an- 
tes do meio-dia as bolas 1 a 10 sejam colocadas na urna e a bola 1 seja então 
retirada; meio minuto antes do meio-dia, as bolas 11 a 20 sejam colocadas na 
urna e a bola 2 seja sacada. Um quarto de minuto antes do meio-dia, as bolas 21 
a 30 sejam colocadas na urna e a bola 3 seja sacada; um oitavo de minuto antes 
do meio-dia, as bolas 31 a 40 sejam colocadas na urna e a bola número 4 seja 
retirada, e assim por diante. Neste novo experimento, quantas bolas estarão na 
urna ao meio-dia? 

Surpreendentemente, a resposta agora é que urna estará vazia ao meio-dia. 
Pois bem, considere qualquer bola — digamos, a bola n. Em algum instante an- 


n-1 
terior ao meio-dia [em particular, (3) minutos antes do meio dia], essa bola 


terá sido retirada da urna. Com isso, para cada n, a bola número n não estará na 
urna ao meio-dia; portanto, a urna deve estar vazia neste horário. 

Vemos então, da discussão anterior, que a maneira pela qual as bolas 
são retiradas faz toda a diferença. Isso porque, no primeiro caso, apenas as 
bolas de número 10n,n = 1, são retiradas, enquanto no segundo caso todas 
as bolas acabam sendo retiradas. Vamos agora supor que sempre que uma 
bola seja retirada, ela seja aleatoriamente selecionada dentre aquelas pre- 
sentes. Isto é, suponha que um minuto antes do meio-dia as bolas de 1 a 10 
sejam colocadas na urna e que uma bola seja aleatoriamente selecionada e 
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retirada, e assim por diante. Neste caso, quantas bolas estarão na urna ao 
meio-dia? 


Solução Vamos mostra que, com probabilidade 1, a urna estará vazia ao 
meio-dia. Vamos primeiro considerar a bola número 1. Defina E, como o even- 
to em que a bola número 1 ainda esteja na urna após as n primeiras retiradas. 
Claramente, 


9-.18.27-.-(9n) 
10 -19.28-.-(9n + 1) 


P(En) = 


(Para entender essa equação, note apenas que se a bola número 1 ainda estiver 
na urna após as primeiras n retiradas, a primeira bola sacada da urna pode ser 
qualquer uma de 9, a segunda pode ser qualquer uma de 18 [há 19 bolas na urna 
no momento da segunda retirada, uma das quais deve ser a bola 1], e assim por 
diante. O denominador é obtido de maneira similar). 

E Agora, o evento “bola 1 está na urna ao meio-dia” é simplesmente o evento 
(1 En. Como os eventos E, são eventos decrescentes, n = 1, tem-se da Propo- 
n=1 

sição 6.1 que 


P(bola 1 está na urna ao meio-dia) 
oo 
=P (En 
n=1 
E) 


= Ei (5 1) 


n=1 


Agora mostramos que 
oo 
9 
IH RE ibid =0 
9n+1 
n=1 
Já que 


Li(o)= [5 


n=1 n=1 


isso é equivalente a mostrar que 
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Agora, para todom = 1, 


n=1 n=1 
1 1 1 1 
alrecitia dus — 
Ee) e) 
Da e do 
>= — — —— . Fani” 
9 18 27 9m 


oo 
Com isso, fazendo m>oº e usando o fato de que >" 1/i = oo, temos 
i=1 


(6,6) 
1 

l+—|=o 
L(t + o) 
n=1 
Assim, fazendo com que F, represente o evento “bola i está na urna ao meio- 
dia? mostramos que P(F,) = 0. Similarmente, podemos mostrar que P(F;) = 0 
para todo i. es 


(Por exemplo, o mesmo raciocínio mostra que P(F;) = |[[9n/(0n + D] 
=2 
para i = 11,12,...,20.) Portanto, a probabilidade de que a urna não esteja vazia 


oo 
ao meio-dia, P | [UU F; |, satisfaz 


! o oo 
P Ur 5 PF)=0 
1 1 


pela desigualdade de Boole (Exercício de Autoteste 2.14) 
Assim, com probabilidade 1, a urna estará vazia ao meio-dia. a! 


2.7 PROBABILIDADE COMO UMA MEDIDA DE CRENÇA 


Até agora interpretamos a probabilidade de um evento de certo experimento 
como sendo uma medida da frequência de ocorrência desse evento quando 
o experimento é repetido continuamente. Entretanto, existem também ou- 
tros usos para o termo probabilidade. Por exemplo, todos nós já ouvimos algo 
como “a probabilidade de que Shakespeare tenha realmente escrito Hamlet 
é de 90%”) ou “A probabilidade de que Lee Harvey Oswald tenha agido so- 
zinho no assassinato de Kennedy é de 0,87 Como podemos interpretar essas 
frases? 

A interpretação mais simples e natural é a que as probabilidades citadas 
são medidas da crença de um indivíduo. Em outras palavras, o indivíduo que 
diz as frases acima está bem certo de que Lee Harvey Oswald agiu sozinho e 
ainda mais certo de que Shakespeare escreveu Hamlet. Essa interpretação da 
probabilidade como sendo uma medida de crença é chamada de visão pessoal 
ou subjetiva da probabilidade. 
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Parece lógico supor que “uma medida de crença” deva satisfazer todos 
os axiomas da probabilidade. Por exemplo, se temos 70% de certeza de que 
Shakespeare escreveu Júlio César e 10% de certeza de que foi na realidade 
Marlowe quem escreveu essa peça, então é lógico supor que temos 80% de 
certeza de que foi Shakespeare ou Marlowe quem a escreveu. Com isso, seja 
com a interpretação da probabilidade como uma medida de crença ou como 
uma frequência de ocorrência em uma longa sequência de experimentos, suas 
propriedades matemáticas permanecem inalteradas. 


Exemplo 7a 

Suponha que, em uma corrida de 7 cavalos, você sinta que cada um dos 2 pri- 
meiros cavalos tem 20% de chance de vencer, os cavalos 3 e 4 têm uma chance 
de 15%, e os três cavalos restantes têm uma chance de 10% cada. Seria melhor 
para você apostar, podendo ganhar o mesmo que apostou, na vitória dos três 
primeiros cavalos ou na vitória dos cavalos 1,5,6 e 7? 


Solução Com base em suas probabilidades pessoais a respeito do resultado 
da corrida, a probabilidade de você vencer a primeira aposta é de 0,2 + 0,2 
+0,15 = 0,55, enquanto a de vencer a segunda aposta é de 0,2 + 0,1 +0,1+01 
= 0,5. Com isso, a primeira aposta é mais atraente. [na] 


Note que, ao supormos que as probabilidades subjetivas de uma pessoa 
são sempre consistentes com os axiomas da probabilidade, estamos tratando de 
uma pessoa idealizada e não de uma pessoa de verdade. Por exemplo, se fôsse- 
mos perguntar a alguém quais seriam, em sua opinião, as chances de 


(a) chover hoje, 

(b) chover amanhã, 

(c) chover hoje e amanhã, 
(d) chover hoje ou amanhã, 


é bem possível que, após pensar um pouco, esse alguém desse 30%, 40%, 20% e 
60% como respostas. Infelizmente, tais respostas (ou tais probabilidade subjeti- 
vas) não são consistentes com os axiomas da probabilidade (por que não?). Na- 
turalmente, esperaríamos que, depois que tal objeção fosse colocada à pessoa 
consultada, ela mudasse as suas respostas (por exemplo, poderíamos aceitar 
30%, 40%, 10% e 60%). 


RESUMO 


Seja S o conjunto de todos os possíveis resultados de um experimento. S é cha- 
mado de espaço amostral do experimento. Um evento é um subconjunto de S. 


n 
Se 4, são eventos, com i = 1...., n, então o conjunto U A;, chamado de união 
i=1 
desse eventos, é formado por todos os resultados que aparecem em pelo menos 
n 


um dos eventos 4, i = 1,...,n. Similarmente, o conjunto (7) A;, às vezes escrito 
i=1 
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como 4,... 4,, é chamado de interseção dos eventos 4, e é formado por todos 
os resultados que aparecem em todos os eventos A,i = 1,...,n. 

Para cada evento A, definimos A” como sendo correspondente a todos os 
resultados no espaço amostral que não estão em 4. Chamamos A“ de comple- 
mento do evento A. O evento S”, que não possui resultados, é representado pelo 
símbolo (5 e é chamado de conjunto vazio. Se AB = (), então dizemos que A e 
B são mutuamente exclusivos. 

Para cada evento A do espaço amostral S, supomos que o número P(A), 
chamado de probabilidade de 4, seja definido de forma que 

(1) 0=P(A)=1 
(i) P(S)=1 


(iii) Para eventos 4, mutuamente exclusivos, i = 1, 
oo 00 

PHJA|=5 Pa; 
i=1 i=1 


P(A) representa a probabilidade de que o resultado do experimento esteja em 4. 
Pode-se mostrar que 


P(A)=1 — P(A) 
Um resultado útil é dado pela equação a seguir, 
PAU B)=P(A) + P(B) — P(AB) 


que pode ser generalizada para fornecer 


PIJA|=> PA) —- DD Praia) + DDD PAGÃO 
i=i i=1 


i<j i<xj<k 
+ + (DHIPÇA, An) 


Se S é finito e se supõe que cada um dos pontos do conjunto tenha a mesma 
probabilidade de ocorrer, então 
14] 


P(A) = — 
(A) is] 


onde |A| representa o número de resultados no evento A. 
A probabilidade P(A) pode ser interpretada como uma frequência relativa 
de ocorrência em uma longa sequência de experimentos ou como uma medida 


de crença. 
PROBLEMAS 
2.1 Uma caixa contém 3 bolas de gude: 1 ver- bola de gude da caixa, colocar outra em seu 
melha, 1 verde e uma azul. Considere um lugar e então retirar uma segunda bola da 


experimento que consiste em retirar uma caixa. Descreva o espaço amostral. Repita 


considerando que a segunda bola seja reti- 
rada sem que a primeira seja substituída. 


2.2 Em um experimento, um dado é rolado 


continuamente até que um 6 apareça, 
momento em que o experimento é in- 
terrompido. Qual é o espaço amostral do 
experimento? Chame de E, o evento em 
que o dado é rolado n vezes para que o 
experimento seja finalizado. Que pontos 
do espaço amostral estão contidos em 


E,? O que é (0 6.) 2 
1 


2.3 Dois dados são lançados. Seja E o even- 


to em que a soma dos dados é ímpar, F 
o evento em que o número 1 sai em pelo 
menos um dos dados, e G o evento em 
que a soma dos dados é igual a 5. Descre- 
va os eventos EF,E U F, FG, EF e EFG. 


24 4,Be € se alternam jogando uma moe- 


da. O primeiro a tirar cara vence. O espa- 
ço amostral deste experimento pode ser 
definido como 


6 = [ 1,01,001,0009,..., 
= [ 0000... 


(a) Interprete o espaço amostral 
(b) Defina os eventos a seguir em termos 
de S: 
(i) A vence = A 
(ii) Bvence = B 
(ii) (AU BJ. 
Suponha que 4 jogue a moeda 
primeiro, então B, então C, en- 
tão 4, e assim por diante. 


2.5 Um sistema é formado por 5 componen- 


tes; cada um deles ou está funcionando 

ou está estragado. Considere um experi- 

mento que consiste em observar a condi- 

ção de cada componente e represente o 

resultado do experimento como o vetor 

(X4> Xo, X3, Xys X5), onde x, é iguala 1 se o 

componente i estiver funcionando e igual 

a 0 se o componente i estiver estragado. 

(a) Existem quantos resultados no espaço 
amostral deste experimento? 

(b) Suponha que o sistema irá funcionar 
se os componentes 1 e 2 estiverem 
funcionando, ou se os componentes 
3 e 4 estiverem funcionando, ou se os 
componentes 1,3 e 5 estiverem fun- 
cionando. Seja W o evento em que o 
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sistema irá funcionar. Especifique to- 
dos os resultados em W. 

(c) Seja 4 o evento em que os componen- 
tes 4 e 5 estão estragados. Quantos re- 
sultados estão contidos no evento 4? 

(d) Escreva todos os resultados no evento 
AW. 


2.6 O administrador de um hospital codifica 


os pacientes baleados atendidos no pron- 

to-socorro de acordo com o fato de eles 

terem ou não plano de saúde (1 se tive- 
rem e O se não tiverem) e de acordo com 

a sua condição, que é classificada como 

boa (b), razoável (r) ou séria (s). Conside- 

re o experimento que consiste em codifi- 
car um paciente baleado. 

(a) Forneça o espaço amostral deste ex- 
perimento. 

(b) Seja 4 o evento em que o paciente 
está em uma condição séria. Especifi- 
que os resultados de 4. 

(c) Seja B o evento em que o paciente 
não possui seguro. Especifique os re- 
sultados em B. 

(d) Forneça todos os resultados do even- 
toBCU A. 


2.7 Considere um experimento que consiste 


em determinar o tipo de trabalho — braçal 
ou não — e a afiliação política — republica- 
no, democrata ou independente — dos 15 
jogadores de um time de futebol. Quantos 
resultados existem no espaço amostral? 
(b) no evento em que pelo menos um jo- 
gadores é um trabalhador braçal? 
(c) no evento em que nenhum dos joga- 
dores se considera independente? 


2.8 Suponha que A e B sejam eventos mutu- 


amente exclusivos para os quais P(A) = 
0,3 e P(B) = 0,5. Qual é a probabilidade 
de que: 

(a) A ou B ocorra? 

(b) A ocorra mas B não ocorra? 

(c) Ae B ocorram? 


2.9 Uma loja aceita cartões de crédito Ame- 


rican Express ou Visa. Um total de 24% 
de seus consumidores possui um cartão 
da American Express, 61% possuem um 
cartão Visa e 11% possuem ambos. Que 
percentual desses consumidores possui 
um cartão aceito pelo estabelecimento? 


2.10 Sessenta por cento dos estudantes de 


certa escola não usam nem anel nem co- 
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lar. Vinte por cento usam um anel e 30% 

usam um colar. Se um dos estudantes for 

escolhido aleatoriamente, qual é a pro- 
babilidade de que este estudante esteja 
usando: 

(a) um anel ou um colar? 

(b) um anel e um colar? 

2.11 Um total de 28% dos homens americanos 
fuma cigarros, 7% fumam charutos e 5% 
fumam cigarros e charutos. 

(a) Que percentual de homens é não fu- 
mante? 

(b) Que percentual fuma charutos mas 
não cigarros? 

2.12 Uma escola fundamental oferece três 
cursos de línguas: um de espanhol, um de 
francês e outro de alemão. As classes estão 
abertas para todos os 100 estudantes da 
escola. Há 28 estudantes na classe de espa- 
nhol, 26 na classe de francês e 16 na classe 
de alemão. Há 12 estudantes que fazem 
aulas de espanhol e francês, 4 que fazem 
aulas de espanhol e alemão, e 6 que fazem 
aulas de francês e alemão. Além disso, há 2 
estudantes fazendo os três cursos. 

(a) Se um estudante é escolhido aleatoria- 
mente, qual é a probabilidade de que 
ele ou ela não esteja matriculado(a) 
em nenhum dos cursos? 

(b) Se um estudante é escolhido aleato- 
riamente, qual é a probabilidade de 
que ele ou ela esteja fazendo exata- 
mente um curso de línguas? 

(c) Se dois estudantes são escolhidos ale- 
atoriamente, qual é a probabilidade 
de que pelo menos um deles esteja 
fazendo um curso de línguas? 

2.13 Certa cidade com uma população de 
100.000 habitantes possui 3 jornais: 1, 
e II. As proporções de moradores que 
leem esses jornais são as seguintes: 


110% Ie 11:8% Ielle HI.:1% 
1:30%  Iell:2% 
0L.5% Me TI: 4% 


(Essa lista nos diz, por exemplo, que 8.000 

pessoas leem os jornais le II.) 

(a) Determine o número de pessoas que 
leem apenas um jornal. 

(b) Quantas pessoas leem pelo menos 
dois jornais? 

(c) Se Te II são jornais matutinos e TI é 
um jornal vespertino, quantas pessoas 


leem pelo menos um jornal matutino 
mais um jornal vespertino? 

(d) Quantas pessoas não leem nenhum 
jornal? 

(e) Quantas pessoas leem apenas um jor- 
nal matutino e um jornal vespertino? 

2.14 Os dados a seguir foram obtidos com a 
pesquisa de um grupo de 1000 assinan- 
tes de uma revista: avaliando-se trabalho, 
estado civil e instrução, verificou-se que 
havia 312 pessoas empregadas, 470 pes- 
soas casadas, 525 pessoas formadas em 
universidades, 42 pessoas formadas em 
escolas técnicas, 147 pessoas formadas em 
universidades e casadas, 86 pessoas com 
emprego e casadas, e 25 pessoas com em- 
prego formadas em universidades e casa- 
das. Mostre que os números apontados 
por esse estudo estão incorretos. 

Dica: Suponha que C, E e U representem, 

respectivamente, o conjunto de pessoas 

casadas, de pessoas com emprego e de 
pessoas formadas em universidades. Su- 
ponha que uma das 1000 pessoas seja es- 
colhida aleatoriamente e se use a Propo- 
sição 4.4 para mostrar que, se os números 
fornecidos estiverem corretos, então P(C 
VUEUU)>1 52 

2.15 Se é assumido que todas as ( $ ) mãos 
de pôquer são igualmente prováveis, qual 
é a probabilidade de alguém sair com 
(a) um flush (uma mão é chamada de 

flush se todas as 5 cartas são do mes- 
mo naipe)? 

(b) um par (que ocorre quando as cartas 
são do tipo a,a,b,c,d, onde a,b, ce d 
são cartas distintas)? 

(c) dois pares (que ocorre quando as car- 
tas são do tipo a,a,b,b,c onde a,be c 
são cartas distintas)? 

(d) trinca (que ocorre quando as cartas 
são do tipo a,a,a,b, conde a,b e c 
são cartas distintas)? 

(e) quadra (que ocorre quando as cartas 
são do tipo a, a,a,a,b, onde a e b são 
cartas distintas)? 

2.16 Pôquer com dados é jogado com o lan- 
camento simultâneo de 5 dados. Mostre 
que: 

(a) Pfnenhum dado de mesmo valor) = 
0,0926 


(b) Pfum par) = 0,4630 

(c) Pídois pares) = 0,2315 

(d) Pftrinca) = 0,1543 

(e) Pfuma trinca e um par) = 0,0386 

(£) Plquadro dados iguais) = 0,0193 

(g) Pfcinco dados iguais) = 0,0008 

2.17 Se 8 torres são colocadas aleatoriamen- 
te em um tabuleiro de xadrez, calcule a 
probabilidade de que nenhuma das torres 
possa capturar qualquer uma das demais. 
Isto é, compute a probabilidade de que 
nenhuma linha contenha mais que uma 
torre. 

2.18 Duas cartas são selecionadas aleatoria- 
mente de um baralho comum. Qual é a 
probabilidade de que elas formem um 
vinte e um? Isto é, qual é a probabilidade 
de que um das cartas seja um ás e a outra 
seja ou um dez, um valete, uma dama ou 
um rei? 

2.19 Dois dados simétricos têm dois de seus la- 
dos pintados de vermelho, dois de preto, 
um de amarelo e o outro de branco. Quan- 
do esse par de dados é rolado, qual é a pro- 
babilidade de que ambos os dados saiam 
com uma face de mesma cor para cima? 

2.20 Suponha que você esteja jogando vinte 
e um contra um crupiê. Em um baralho 
que acabou de ser embaralhado, qual é 
a probabilidade de que nem você nem o 
crupiê saiam com um vinte e um (ás mais 
um dez, um valete, uma dama ou rei)? 

2.21 Uma pequena organização comunitária é 
formada por 20 famílias, das quais 4 têm 
uma criança, 8 têm duas crianças, 5 têm 
três crianças, 2 têm quatro crianças e 1 
tem 5 crianças. 

(a) Se uma dessas famílias é escolhida 
aleatoriamente, qual é a probabilida- 
de de que ela tenha i crianças, i = 1,2, 
3,4,5? 

(b) Se uma das crianças é escolhida alea- 
toriamente, qual é a probabilidade de 
que a criança venha de uma família 
com icrianças, i=1,2,3,4,5? 

2.22 Considere a seguinte técnica para emba- 
ralhar um baralho de n cartas: para qual- 
quer ordem inicial das cartas, percorra o 
baralho tirando uma carta de cada vez 
e, para cada carta, jogue uma moeda. Se 
der cara, então deixe a carta onde está; 
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se der coroa, então ponha a carta no fim 
do baralho. Após ter jogado a moeda n 
vezes, considere que uma rodada tenha 
sido completada. Por exemplo, sen = 4€ 
a ordem inicial for 1, 2, 3, 4, se a moeda 
der cara, coroa, coroa, cara, então a ordem 
das cartas no final da rodada será 1, 4,2, 
3. Supondo que todos os resultados possí- 
veis da sequência de n jogadas de moeda 
sejam igualmente prováveis, qual é a pro- 
babilidade de que a ordem das cartas após 
uma rodada seja igual à ordem inicial? 

2.23 Rola-se um par de dados honestos. Qual 
é a probabilidade de o segundo dado sair 
com um valor maior do que o primeiro? 

2.24 Se dois dados são rolados, qual é a pro- 
babilidade de que a soma das faces para 
cima seja igual a i? Determine essa pro- 
babilidade para i = 2,3,...,11,12. 

2.25 Um par de dados é rolado até que saia 
uma soma igual a 5 ou 7. Determine a pro- 
babilidade de que um resultado igual a 5 
ocorra primeiro. Dica: Suponha que E, 
represente o evento em que um resulta- 
do igual 5 ocorra na n-ésima rodada e que 
um resultado igual a 5 ou 7 não ocorra nas 
primeiras n — 1 rodadas. Compute P(E,) 
e mostre que >" P(E,) é a probabilidade 
desejada. 

2.26 Um popular jogo de dados é jogado da 
seguinte maneira: um jogador rola dois 
dados. Se a soma dos dados é igual a 2, 
3 ou 12,0 jogador perde; se a soma é 
igual a 7 ou 11, ele vence. Para qualquer 
resultado diferente, o jogador continua a 
rolar os dados até que o resultado inicial 
saia novamente ou que saia um 7 Se o 7 
aparecer primeiro, o jogador perde; se o 
resultado inicial for repetido antes que o 
7 apareça, o jogador vence. Calcule a pro- 
babilidade de um jogador vencer neste 
jogo de dados. 

Dica: Suponha que E, represente o even- 
to em que a saída inicial é i e o jogador 
vence: A probabilidade desejada é igual a 
>» P(E). Para computar P(E,), defina os 
i=2 

eventos E,, como aqueles em que a soma 
inicial é i e o jogador vence na n-ésima 
rodada. Mostre que P(E;) = 5 Ein). 


n=1 


2.27 Uma urna contém 3 bolas vermelhas e 7 


bolas pretas. Os jogadores 4 e B retiram 
bolas da urna alternadamente até que 
uma bola vermelha seja selecionada. De- 
termine a probabilidade de A selecionar 
uma bola vermelha. (A tira a primeira 
bola, depois B, e assim por diante. Não há 
devolução das bolas retiradas.) 


2.28 Uma urna contém 5 bolas vermelhas, 6 


bolas azuis e 8 bolas verdes. Se um con- 
junto de 3 bolas é selecionado aleatoria- 
mente, qual é a probabilidade de que cada 
uma das bolas seja (a) da mesma cor? (b) 
de cores diferentes? Repita esse problema 
considerando que, sempre que uma bola 
seja selecionada, sua cor seja anotada e 
ela seja recolocada na urna antes da pró- 
xima seleção. Esse experimento é conhe- 
cido como amostragem com devolução. 


2.29 Uma urna contém n bolas brancas e m 


bolas pretas, onde n e m são números po- 
sitivos. 

(a) Se duas bolas são retiradas da urna 
aleatoriamente, qual é a probabilida- 
de de que elas sejam da mesma cor? 
Se uma bola é retirada da urna alea- 
toriamente e então recolocada antes 
que a segunda bola seja retirada, qual 
é a probabilidade de que as bolas sa- 
cadas sejam da mesma cor? 

Mostre que a probabilidade calculada 
na letra (b) é sempre maior do que 
aquela calculada na letra (a)? 


(b) 


(c) 


2.30 Os clubes de xadrez de duas escolas são 


formados por 8 e 9 jogadores, respectiva- 
mente. Quatro membros de cada um dos 
clubes são selecionados aleatoriamente 
para participar de uma competição entre 
as duas escolas. Os jogadores escolhidos 
de um time então formam pares com 
aqueles do outro time, e cada um dos pa- 
res jogam uma partida de xadrez entre 
si. Suponha que Rebeca e sua irmã Eli- 
sa pertençam aos clubes de xadrez, mas 
joguem por escolas diferentes. Qual é a 
probabilidade de que 
(a) Rebeca e Elisa joguem uma partida? 
(b) Rebeca e Elisa sejam escolhidas para 
representar as suas escolas mas não 
joguem uma contra a outra? 
(c) Rebeca ou Elisa sejam escolhidas 
para representar suas escolas? 


2.31 


2.32 


2.33 


2.34 


2.35 


2.36 
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Um time de basquete de 3 pessoas é for- 
mado por um defensor, um atacante e um 
central. 

(a) Se uma pessoa é escolhida aleatoria- 
mente de cada um de três times com 
uma formação igual a essa, qual é a 
probabilidade de um time completo 
ser selecionado? 

(b) Qual é a probabilidade de que os 3 jo- 
gadores selecionados joguem na mes- 
ma posição? 

Um grupo de indivíduos contendo m 

meninos e g garotas é alinhado de forma 

aleatória; isto é, supõe-se que cada uma 
das (m + g)! permutações seja igualmen- 
te provável. Qual é a probabilidade de 
que a pessoa na i-ésima posição, 1 = i = 

m + g,seja uma garota? 

Em uma floresta vivem 20 renas, das quais 

5 são capturadas, marcadas e então soltas. 

Certo tempo depois, 4 das renas são cap- 

turadas. Qual é a probabilidade de que 

2 dessas 4 renas tenham sido marcadas? 

Que suposições você está fazendo? 

Diz-se que o segundo conde de Yarbo- 

rough teria apostado com chances de 

1000 para 1 que uma mão de bridge com 

13 cartas conteria pelo menos uma carta 

maior ou igual a dez (ou seja, uma carta 

igual a um dez, um valete, uma dama, um 
rei ou um ás). Hoje em dia, chamamos de 

Yarborough uma mão que não possua car- 

tas maiores que 9. Qual é a probabilidade 

de que uma mão de bridge selecionada 
aleatoriamente seja um Yarborough? 

Sete bolas são retiradas aleatoriamente 

de uma uma que contém 12 bolas ver- 

melhas, 16 bolas azuis e 18 bolas verdes. 

Determine a probabilidade de que 

(a) 3 bolas vermelhas, 2 bolas azuis e 2 
bolas verdes sejam sacadas; 

(b) pelo menos duas bolas vermelhas se- 
jam sacadas; 

(c) todas as bolas sacadas sejam de mes- 
ma cor; 

(d) exatamente 3 bolas vermelhas ou exa- 
tamente 3 bolas azuis sejam sacadas. 

Duas cartas são escolhidas aleatoriamen- 

te de um baralho de 52 cartas. Qual é a 

probabilidade de 

(a) ambas serem ases? 

(b) ambas terem o mesmo valor? 


2.37 Um instrutor propõe para a classe um 
conjunto de 10 problemas com a infor- 
mação de que o exame final será formado 
por uma seleção aleatória de 5 deles. Se 
um estudante tiver descoberto como re- 
solver 7 dos problemas, qual é a probabi- 
lidade de que ele ou ela venha a respon- 
der corretamente: 

(a) todos os 5 problemas? 
(b) pelo menos 4 dos problemas? 

2.38 Existem n meias em uma gaveta, 3 das 
quais são vermelhas. Qual é o valor de n 
se a probabilidade de que duas meias ver- 
melhas sejam retiradas aleatoriamente da 
gaveta é igual a 1/2? 

2.39 Existem 5 hotéis em certa cidade. Se, em 
um dia, 3 pessoas fizerem registro nesses 
hotéis, qual é a probabilidade de que elas 
se registrem em hotéis diferentes? Que 
suposições você está fazendo? 

2.40 Uma cidade contém 4 pessoas que con- 
sertam televisões. Se 4 aparelhos estive- 
rem estragados, qual é a probabilidade 
de que exatamente i dos técnicos sejam 
chamados? Que suposições você está fa- 
zendo? 

2.41 Se um dado é rolado 4 vezes, qual é a 
probabilidade de que o 6 saia pelo menos 
uma vez? 

2.42 Dois dados são jogados n vezes em se- 
quência. Compute a probabilidade de 
que um duplo 6 apareça pelo menos uma 
vez. Quão grande deve ser n para que 
essa probabilidade seja pelo menos igual 
a1/22 

2.43 (a) Se N pessoas, incluindo A e B, são dis- 

postas aleatoriamente em linha, qual 
é a probabilidade de que A e B este- 
jam uma ao lado da outra? 

(b) E se as pessoas tivessem sido dispos- 
tas aleatoriamente em círculo? 

2.44 Cinco pessoas, designadas como 4, B, C, 
D, E, são arranjadas em uma sequência li- 
near. Supondo que cada uma das ordena- 
ções possíveis seja igualmente provável, 
qual é a probabilidade de que: 

(a) exista exatamente uma pessoa entre 
AeB? 

(b) existam exatamente duas pessoas en- 
tre A eB? 
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(c) existam três pessoas entre 4 e B? 

2.45 Uma mulher tem n chaves, das quais uma 
abre a sua porta. 

(a) Se ela tentar usar as chaves aleatoria- 
mente, descartando aquelas que não 
funcionam, qual é a probabilidade de 
ela abrir a porta em sua k-ésima ten- 
tativa? 

(b) E se ela não descartar as chaves já uti- 
lizadas? 

2.46 Quantas pessoas têm de estar em uma 
sala para que a probabilidade de que pelo 
menos duas delas celebrem aniversário 
no mesmo mês seja igual a 1/2? Suponha 
que todos os possíveis resultados mensais 
sejam igualmente prováveis. 

2.47 Se há 12 estranhos em uma sala, qual é a 
probabilidade de que nenhum deles cele- 
bre aniversário no mesmo dia? 

2.48 Dadas 20 pessoas, qual é a probabilidade 
de que, entre os 12 meses do ano, existam 
4 meses contendo exatamente 2 aniversá- 
rios e 4 contendo exatamente 3 aniversá- 
rios? 

2.49 Um grupo de 6 homens e 6 mulheres é di- 
vidido aleatoriamente em 2 grupos de 6 
pessoas cada. Qual é a probabilidade de 
que ambos os grupos possuam o mesmo 
número de homens? 

2.56 Em uma mão de bridge (13 cartas) deter- 
mine a probabilidade de que você tenha 5 
cartas de espadas e seu parceiro tenha as 
8 cartas de espadas restantes? 

2.51 Suponha que n bolas sejam aleatoria- 
mente distribuídas entre N compartimen- 
tos. Determine a probabilidade de que m 
bolas caiam no primeiro compartimento. 
Suponha que todos os Nº arranjos sejam 
igualmente prováveis. 

2.52 Um armário contém 10 pares de sapatos. 
Se 8 sapatos são selecionados aleatoria- 
mente, qual é a probabilidade de 
(a) nenhum par completo ser formado? 
(b) ser formado exatamente 1 par com- 

pleto? 

2.53 Se quatro casais estão dispostos em linha, 
determine a probabilidade de nenhum 
marido se sentar ao lado de sua esposa. 

2.54 Compute a probabilidade de que uma 
mão de bridge esteja vazia em pelo me- 
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nos uma sequência. Note que a resposta 


não é 
49/39 
1 13 
52 
13 
(Por que não?) 
Dica: Use a Proposição 4.4 
2.55 Compute a probabilidade de que uma 
mão de 13 cartas contenha: 
(a) o ás e o rei de pelo menos um naipe; 


(b) todos os naípes de pelo menos uma 
das 13 cartas diferentes. 


Figura 2.6 Roletas. 


2.56 Dois jogadores jogam o seguinte jogo: o 
jogador 4 escolhe uma das três roletas 
desenhadas na Figura 2.6 e então o joga- 
dor B escolhe uma das duas roletas res- 
tantes. Então, ambos os jogadores giram 
suas roletas e aquele cuja roleta sair com 
o maior número é declarado vencedor. 
Supondo que cada uma das 3 regiões de- 
senhadas em cada uma das roletas tenha 
a mesma probabilidade de sair, você pre- 
feriria ser o jogador 4 ou B? Explique a 
sua resposta! 


EXERCÍCIOS TEÓRICOS 


Prove as seguintes relações: 
21 EFCECEUF 
22 SeECF,entãoF C E. 
23 F=FEUFEcCEUF=EUEF. 


oo oo 
24(UE]F=UVEF e 
1 1 


(ie) TER EA: 
1 1 


2.5 Para qualquer sequência de eventos E,, 
E,,..., defina uma nova sequência F,, F,... 
de eventos disjuntos (isto é, eventos tais 
que FF, = sempre que i  j) de forma 
que, para todon = 1, 


n n 
Ur=Us 
1 1 


2.6 Sejam três eventos E, Fe G. Determine 
expressões para esses eventos de forma 
que, de E, Fe G, 

(a) apenas E ocorra; 

(b) Ee G ocorram, mas não F, 

(c) pelo menos um dos eventos ocorra; 

(d) pelo menos dois dos eventos ocor- 
ram; 

(e) todos os três eventos ocorram; 

(f) nenhum dos eventos ocorra; 

(g) no máximo um dos eventos ocorra; 

(h) no máximo dois dos eventos ocor- 
ram; 

(j)) no máximo três dos eventos ocorram. 

2.7 Determine a expressão mais simples para 
os seguintes eventos: 

(a) (EU FIXE UF); 
(b) (EU XE U PEV F); 
(co) (EU F(FU 6). 

2.8 Seja $ um dado conjunto. Se, para algum 
k>0,5, $,,..., 3, são subconjuntos de $ 
não nulos e mutuamente exclusivos de 
forma que (JS; = S,então chamamos 

i=l 
o conjunto (S,,$,,...,S,) uma partição de S. 
Suponha que T, represente o número de 
diferentes partições de (1, 2,...,n]). Assim, 
T, = 1 (aúnica partição é S, = (IDe 7, = 
2 (as duas partições são [[1,2)).1[1),[2))). 
(a) Mostre, calculando todas as partições, 
que T;=5,7,= 15. 
(b) Mostre que 


e use essa equação para computar 

To 
Dica: Uma maneira de escolher uma 
partição de n + 1 itens é chamar um dos 
itens de especial. Então, obtemos diferen- 
tes partições primeiramente escolhendo 
k,k = 0,1,...,n, depois um subconjunto de 
tamanho n — k dos itens que não são espe- 
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ciais, então qualquer uma das T, partições 
dos itens não especiais restantes. Acres- 
centando o item especial ao subconjunto 
de tamanho n — k, podemos obter uma 
partição de todos os n + 1 itens. 

2.9 Suponha que um experimento seja reali- 
zado n vezes. Para qualquer evento E do 
espaço amostral, suponha que n(E) repre- 
sente o número de vezes em que o evento 
E ocorre e defina HE) = n(E)/n. Mostre 
que f(:) satisfaz os Axiomas 1,2 e 3. 

2.10 Demonstre que (EU FU G) = PME) 
+ P(P) + P(G) — P(E'FG) - P(EF'G) - 
P(EFGS, -2P(EFG). 

211 Se P(E) = 0,9 e P(F) = 0,8, mostre que 
P(EF) = 0,7 De forma geral, demonstre a 
desigualdade de Bonferroni, isto é 


P(EF) = P(E) + P(P)-1 


2.12 Mostre que a probabilidade de que exa- 
tamente um dos eventos E ou F ocorra é 
iguala P(E) + P(FP) -2P(EF). 

2.13 Demonstre que P(EF) = P(E) - P(EP). 

2.14 Demonstre a Proposição 4.4 por indução 
matemática. 

2.15 Uma urna contém M bolas brancas e N 
bolas pretas. Se uma amostra aleatória de 
tamanho r é escolhida, qual é a probabi- 
lidade de que ela contenha exatamente k 
bolas brancas? 

2.16 Use a indução para generalizar a desi- 
gualdade de Bonferroni para n eventos. 
Isto é, mostre que 


P(EE...E)>PE)+..+P(E)-(n-1) 


2.17 Considere o problema do pareamento, 
visto no Exemplo 5m, e defina 4, como 
o número de maneiras pelas quais N ho- 
mens podem selecionar seus chapéus de 
forma que nenhum deles selecione o seu 
próprio chapéu. Mostre que 


An=(N-1(Ay + Ay) 


Essa fórmula, juntamente com as condi- 
ções de contorno 4, = 0,4, = 1, pode 
então ser resolvida para 4,, e a probabili- 
dade desejada de que não ocorram parea- 
mentos seria A,/N!. 

Dica: Após o primeiro homem selecionar 
um chapéu que não é o seu, haverá ainda 
N-—1 homens para selecionar um chapéu 


de um conjunto de N — 1 chapéus. Note 
que esse conjunto não contém o chapéu 
de um desses homens. Assim, há um ho- 
mem extra e um chapéu extra. Mostre 
que podemos obter a condição de ausên- 
cia de pareamento seja com o homem ex- 
tra selecionando o chapéu extra ou com o 
homem extra não selecionando o chapéu 
extra. 


2.18 Suponha que f, represente o número de 


maneiras de jogar uma moeda n vezes de 
forma que nunca saiam caras sucessivas. 
Mostre que 


f-fatfo nz2ondefh=1,h=2 


Dica: Existem quantos resultados que co- 
meçam com uma cara e quantos que co- 
meçam com uma coroa? Se P, representa 
a probabilidade de que caras sucessivas 
nunca apareçam quando uma moeda é jo- 
gada n vezes, determine P, (em termos de 
£.) quando todos os resultados possíveis 
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Dica: Um total de k bolas será retirado 
se houver » — 1 bolas vermelhas nas pri- 
meiras k — 1 retiradas e se a k-ésima bola 
retirada for vermelha. 


2.20 Considere um experimento cujo espa- 


ço amostral é formado por um número 
infinito porém contável de pontos. Mos- 
tre que nem todos os pontos podem ser 
igualmente prováveis. Todos os pontos 
podem ter uma probabilidade de ocor- 
rência positiva? 


*2.21 Considere o Exemplo 5o, que lida com 


o número de séries de vitórias obtidas 
quando n vitórias e m derrotas são per- 
mutadas aleatoriamente. Agora, conside- 
re o número total de séries — isto é, séries 
de vitórias mais séries de derrotas — e 
mostre que 


EE Dir, 
a k-1 k-1 
PLk séries) = 2 


das n jogadas forem igualmente prováveis. == 
Compute Pp. PDk + 1 séries) 


2.19 Uma urna contém n bolas vermelhas e (E — 1 J(" = ) +(7 = 1 o E õ 
m bolas azuis. Elas são retiradas uma de k=1 k 


cada vez até que um total de r,r <= n, bo- 
las vermelhas tenha sido retirado. Deter- 
mine a probabilidade de que um total de 
k bolas seja retirado. 


PROBLEMAS DE AUTOTESTE E EXERCÍCIOS 


2.1 Uma cantina oferece um menu de três 


pratos composto por uma entrada, uma 
guarnição e uma sobremesa. As opções 
possíveis são dadas na tabela a seguir: 


Refeição Opções 
Entrada Galinha ou bife grelhado 
Guarnição Massa ou arroz ou batata 


Sobremesa Sorvete ou gelatina ou torta 


de maçã ou uma pera 


Uma pessoa deve escolher um prato de 

cada categoria. 

(a) Há quantos resultados no espaço 
amostral? 

(b) Seja 4 o evento em que o sorvete é es- 
colhido. Há quantos resultados em 4? 


(c) Seja Bo evento em que a galinha é es- 
colhida. Há quantos resultados em 8? 

(d) Liste todos os resultados do evento 
AB. 

(e) Seja Co evento em que o arroz é esco- 
lhido. Há quantos resultados em €? 

(f) Liste todos os resultados no evento 
ABC. 


2.2 Um cliente que visita o departamento de 


ternos de um loja tem probabilidade 0,22 
de comprar um terno, 0,30 de comprar 
uma camisa e 0,28 de comprar uma gra- 
vata. O cliente tem probabilidade 0,11 de 
comprar um terno e uma camisa, 0,14 de 
comprar um terno e uma gravata, e 0,10 
de comprar uma camisa e uma gravata. 
Ele tem probabilidade 0,06 de comprar 


todos os três itens. Qual é a probabilidade 
de o cliente comprar 

(a) nenhum desses itens? 

(b) exatamente 1 desses itens? 

2.3 Um baralho de cartas é distribuído. Qual 
é a probabilidade de que a décima quarta 
carta seja um ás? Qual é a probabilidade 
de o primeiro ás ocorrer na décima quar- 
ta carta? 

2.4 Seja 4 o evento em que a temperatura 
no centro de Los Angeles é de 21ºCe Bo 
evento em que a temperatura no centro de 
Nova York é de 21ºC. Além disso, suponha 
que €C represente o evento em que o má- 
ximo das temperaturas no centro de Nova 
York e Los Angeles é de 21ºC. Se P(A) = 
0,3, P(B) = 0,4e P(C) = 0,2, determine a 
probabilidade de que a temperatura mí- 
nima no centro das duas cidades seja de 
21º€., 

2.5 Embaralha-se um baralho comum de 52 
cartas. Qual é a probabilidade de que as 
quatro cartas de cima tenham 
(a) denominações diferentes? 

(b) naipes diferentes? 

2.6 A urna A contém 3 bolas vermelhas e 3 
bolas pretas, enquanto a urna B contém 4 
bolas vermelhas e 6 bolas pretas. Se uma 
bola é sorteada de cada uma das urnas, 
qual é a probabilidade de que as bolas se- 
jam de mesma cor? 

2.7 Em uma loteria, um jogador deve esco- 
lher 8 números entre 1 e 40. A comissão 
da loteria então realiza um sorteio em 
que 8 desses 40 números são seleciona- 
dos. Supondo que o resultado do sorteio 
tenha a mesma probabilidade de ser igual 


a qualquer uma das | 9 ) combinações 


possíveis, qual é a probabilidade de que 


um jogador tenha 

(a) todos os 8 números sorteados na lo- 
teria? 

(b) 7 dos números sorteados na loteria? 

(c) pelo menos 6 dos números sorteados 
na loteria? 

2.8 De um grupo de 3 calouros, 4 alunos do 
segundo ano, 4 alunos do terceiro ano e 
3 formandos, forma-se aleatoriamente um 
comitê de 4 pessoas. Determine a probabi- 
lidade de que o comitê seja formado por 
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(a) 1 aluno de cada classe; 

(b) 2 alunos do segundo ano e 2 alunos do 
terceiro ano. 

(c) apenas alunos do segundo ou terceiro 
ano. 

2.9 Em um conjunto finito 4, suponha que 

N(A) represente o número de elementos 

em 4. 

(a) Mostre que 


NA UB)= MA) + N(B)- N(AB) 


(b) De forma mais geral, mostre que 


N (04) =5 N(4D — 5) NM(4i4) 
i=1 Ê 


i<j 
+ + (DNA. An) 


2.10 Considere um experimento que consiste 
na corrida de seis cavalos numerados de 
1a 6,e suponha que o espaço amostral 
seja formado pelas 6! ordens de chegada 
possíveis. Seja 4 o evento em que o ca- 
valo de número 1 está entre os três pri- 
meiros classificados e B o evento em que 
o cavalo de número 2 chega em segundo. 
Quantos resultados estão contidos no 
evento 4 U B? 

2.11 Uma mão de cinco cartas é distribuída de 
um baralho de 52 cartas bem embaralha- 
do. Qual é a probabilidade de que a mão 
tenha pelo menos uma carta de cada um 
dos quatro naipes? 

2.12 Uma equipe de basquete é formada por 6 
atacantes e 4 defensores. Se os jogadores 
são divididos em pares de forma aleató- 
ria, qual é a probabilidade de que existam 
exatamente dois pares formados por um 
defensor e um atacante? 

2.13 Suponha que uma pessoa escolha alea- 
toriamente uma letra de RESERVE 
e depois uma letra de VERTICAL. 
Qual é a probabilidade de que a mesma 
letra seja escolhida? 

2.14 Demonstre a desigualdade de Boole: 


P (54) < SPA) 
i=1 i=1 


2.15 Mostre que se P(A;) = 1 paratodoi = 1, 


oo 
entãoP[MNA;|=1. 
i=1 


2.16 Suponha que T,(n) represente o número 


de partições do conjunto (1,..., n] em k 
subconjuntos não vazios, onde l = k =n 
(veja o Exercício Teórico 2.8 para a defi- 
nição de uma partição). Mostre que 


Tá) =kTAn-D + To(n-1) 


Dica: Em quantas partições (1) é um sub- 
conjunto e em quantas partições 1 é um 
elemento de um subconjunto que contém 
outros elementos? 


2.17 Cinco bolas são escolhidas aleatoria- 


mente, sem devolução, de uma urna que 
contém 5 bolas vermelhas, 6 brancas e 7 
azuis. Determine a probabilidade de que 
pelo menos uma bola de cada cor seja es- 
colhida. 


2.18 Quatro bolas vermelhas, 8 azuis e 5 ver- 


des são alinhadas aleatoriamente. 

(a) Qual é a probabilidade de que as pri- 
meiras 5 bolas sejam azuis? 

(b) Qual é a probabilidade de que nenhu- 
ma das primeiras 5 bolas seja azul? 
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(c) Qual é a probabilidade de que as três 
últimas bolas tenham cores diferentes? 

(d) Qual é a probabilidade de que todas 
as bolas vermelhas estejam juntas? 


2.19 Dez cartas são escolhidas aleatoriamente 


de um baralho de 52 cartas formado por 

13 cartas de cada um dos naipes diferen- 

tes. Cada uma das cartas selecionadas é 

colocada em uma de 4 pilhas, dependen- 

do de seu naipe. 

(a) Qual é a probabilidade de que a maior 
pilha tenha 4 cartas, a segunda maior 
tenha 3 cartas, a terceira maior tenha 2 
cartas, e a menor pilha tenha 1 carta? 

(b) Qual é a probabilidade de que duas 
das pilhas tenham 3 cartas, uma tenha 
4 cartas, e uma não tenha cartas? 


2.20 Bolas são removidas aleatoriamente de 


uma urna que contém inicialmente 20 bo- 
las vermelhas e 10 bolas azuis. Qual é a 
probabilidade de que todas as bolas ver- 
melhas sejam retiradas antes que todas as 
bolas azuis? 


Capítulo 
Probabilidade Condicional 
e Independência 
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3.1 INTRODUÇÃO 


Neste capítulo, introduzimos um dos conceitos mais importantes da teoria da 
probabilidade. A importância desse conceito é dupla. Em primeiro lugar, esta- 
mos frequentemente interessados em calcular probabilidades quando temos 
alguma informação parcial a respeito do resultado de um experimento; em tal 
situação, as probabilidades desejadas são condicionais. Em segundo lugar, mes- 
mo quando não temos nenhuma informação parcial sobre o resultado de um 
experimento, as probabilidades condicionais podem ser frequentemente utili- 
zadas para computar mais facilmente as probabilidades desejadas. 


3.2 PROBABILIDADES CONDICIONAIS 


Suponha que lancemos dois dados. Suponha também que cada um dos 36 re- 
sultados possíveis seja igualmente provável e que portanto tenha probabilidade 
1/36. Além disso, digamos que o primeiro dado seja um 3. Então, dada essa 
informação, qual é a probabilidade de que a soma dos 2 dados seja igual a 8? 
Para calcular essa probabilidade, pensamos da seguinte maneira: sabendo que 
saiu um 3 no dado inicial, existirão no máximo 6 resultados possíveis para o 
nosso experimento, isto é, (3,1), (3,2),(3,3), (3,4), (3,5) e (3,6). Como cada um 
desse resultados tinha originalmente a mesma probabilidade de ocorrência, os 
resultados deveriam continuar a ter probabilidades iguais. Isto é, dado que o 
primeiro dado é um 3, a probabilidade (condicional) de cada um dos resultados 
(3,1), (3,2), (3,3), (3,4), (3,5) e (3,6) é 1/6, enquanto a probabilidade (condi- 
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cional) dos outros 30 pontos no espaço amostral é O. Com isso, a probabilidade 
desejada será igual a 1/6. 

Se E e F representarem, respectivamente, o evento em que a soma dos da- 
dos é igual a 8 e o evento em que o primeiro dado é um 3, então a probabilida- 
de que acabamos de obter é chamada de probabilidade condicional de que E 
ocorra dado que F ocorreu e é representada por 


P(EIP) 


Uma fórmula geral para P(E]|F) que seja válida para todos os eventos E e F é 
deduzida da mesma maneira: se o evento F ocorrer, então, para que E ocorra, é 
necessário que a ocorrência real seja um ponto tanto em £ quanto em Fisto é, 
ela deve estar em EF. Agora, como sabemos que F ocorreu, tem-se que F se tor- 
na nosso novo, ou reduzido, espaço amostral; com isso, a probabilidade de que 
o evento EF ocorra será igual à probabilidade de EF relativa à probabilidade 
de F. Isto é, temos a seguinte definição. 


— 


Definição 
Se P(F) > 0, então 
P(EF) 


P(EIF) = PO (2.1) 


Exemplo 2a 


Um estudante faz um teste com uma hora de duração. Suponha que a proba- 
bilidade de que o estudante finalize o teste em menos que x horas seja igual 
a x/2, para todo O = x = 1. Então, dado que o estudante continua a trabalhar 
após 0,75 horas, qual é a probabilidade condicional de que a hora completa seja 
utilizada? 


Solução Seja L, o evento em que o estudante finaliza o teste em menos que x 
horas,0 =x =1,eFo evento em que o estudante usa a hora completa. Como F 
é o evento em que o estudante não finalizou o teste em menos que 1 hora, 


PB =PL9)=1-P(L)=05 


Agora, o evento em que o estudante ainda está trabalhando no horário de 0,75 
horas é o complemento do evento L,,s, então a probabilidade desejada é ob- 
tida de 
PCFLoas) 
P(Logs) 
Edo 

1-— P(Logs) 

0,5 


=-——— = 0,8 
0,625 , n 


P(FIL6ys) = 


Capítulo 3 * Probabilidade Condicional e Independência 83 


Se cada resultado de um espaço amostral finito S é igualmente provável, 
então, tendo como condição o evento em que o resultado está contido no sub- 
conjunto FC S, todos os resultados em F se tornam igualmente prováveis. Em 
tais casos, é muitas vezes conveniente computar probabilidades condicionais 
da forma P(E|F) usando F como o espaço amostral. De fato, trabalhar com 
esse espaço amostral reduzido frequentemente resulta em uma solução mais 
fácil e mais bem compreendida. Nossos próximos exemplos ilustram esse 
ponto. 


Exemplo 2b 


Uma moeda é jogada duas vezes. Supondo que todos os quatros pontos no es- 
paço amostral S = ((h,h), (A, t), (t,h), (t, t)] sejam igualmente prováveis, onde A 
representa cara e t representa coroa, qual é a probabilidade condicional de que 
dê cara em ambas as jogadas, dado que (a) dê cara na primeira jogada? (b) dê 
cara em pelo menos uma das jogadas? 


Solução Seja B=((h,h)) o evento em que ambas as jogadas dão cara; F((A, A), 
(A, t)] o evento em que dá cara na primeira moeda, e A = ((h,h), (A, t), (t,h)] 
o evento em dá cara em pelo menos uma jogada. A probabilidade referente à 
letra (a) pode ser obtida de 
P(BF) 

PU) 
PAM) 
— PAG), AD) 


E Ls 
Saga UR 


P(BIP) = 


Para a letra (b), temos 
P(BA) 
P(A) 
n PUC) 
— PAGA), (h, 0,6) 
—/4 


=34 018 


P(BIA) = 


Assim, a probabilidade de que dê cara em ambas as jogadas dado que a primei- 
ra jogada tenha dado cara é igual a 1/2, enquanto a probabilidade condicional 
de que dê cara em ambas as moedas dado que pelo menos uma delas tenha 
dado cara é igual a 1/3. Muitos estudantes inicialmente acham esse último re- 
sultado surpreendente. Eles pensam que, dado que pelos menos uma moeda dê 
cara, existem dois resultados possíveis: ou dá cara em ambas as moedas ou dá 
cara em apenas uma. Seu engano, no entanto, está em supor que essas duas pos- 
sibilidades são igualmente prováveis. Pois, inicialmente, existem 4 resultados 
igualmente prováveis. Como a informação de que pelo menos uma das jogadas 
dá cara é equivalente à informação de que o resultado não é (£, t), ficamos com 
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os três resultados igualmente prováveis (A, A), (A, t), (t,h), apenas um deles re- 
sultando em cara em ambas as moedas. 0 


Exemplo 2c 


No jogo de bridge, as 52 cartas do baralho são distribuídas igualmente entre 
4 jogadores — chamados leste, oeste, norte e sul. Se norte e sul têm um total 
de 8 espadas, qual é a probabilidade de que leste tenha as 5 cartas de espadas 
restantes? 


Solução Provavelmente, o jeito mais fácil de calcular a probabilidade dese- 
jada é trabalhar com o espaço amostral reduzido. Isto é, dado que norte e sul 
têm um total de 8 espadas entre suas 26 cartas, resta um total de 26 cartas, onde 
exatamente 5 delas são espadas, a serem distribuídas entre as mãos leste-oeste. 
Como cada distribuição é igualmente provável, tem-se que a probabilidade 
condicional de que leste tenha exatamente 3 espadas entre suas 13 cartas é 


igual a 
5 M 
3 10 
++ = 0,339 


26 
13 
Exemplo 2d 


Um total de n bolas é sequencial e aleatoriamente escolhido, sem devolução, de 
uma urna contendo r bolas vermelhas e b bolas azuis (n = r + b). Dado que k 
das n bolas são azuis, qual é a probabilidade condicional de que a primeira bola 
escolhida seja azul? 


Solução Se imaginarmos que as bolas são numeradas, com as bolas azuis re- 
cebendo os números de 1 a b e as bolas vermelhas recebendo os números de 
b + laté b + r, então o resultado do experimento de selecionar n bolas sem 
promover a sua devolução é um vetor de inteiros distintos x,,...,x,, onde cada x, 
está entre 1 e r + b. Além disso, cada um desses vetores tem a mesma probabi- 
lidade de ser o resultado. Assim, dado que o vetor contém k bolas azuis (isto é, 
ele contém k valores entre 1 e b), tem-se que cada um desses resultados é igual- 
mente provável. Mas como a primeira bola escolhida tem, portanto, a mesma 
probabilidade de ser qualquer uma das n bolas escolhidas, das quais k são azuis, 
tem-se que a probabilidade é igual a k/n. 

Se não tivéssemos escolhido trabalhar com o espaço amostral reduzido, 
poderíamos ter resolvido o problema supondo que B fosse o evento em que a 
primeira bola escolhida é azul e B, o evento em que um total de k bolas azuis 
é escolhido. Então 
P(BBk) 

P(BIBy) PB 
— P(BilB)P(B) 
P(By) 
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Agora, P(B,|B) é a probabilidade de que a escolha aleatória de n — 1 bolas de 
uma urna contendo r bolas vermelhas e b — 1 bolas azuis resulte na escolha de 
um total de k — 1 bolas azuis; consequentemente, 
b—1 
(e=1) (124) 
(e 
n-1 


P(BalB) = 


Usando a fórmula anterior juntamente com 
b 
r+b 


P(B) = 
e a probabilidade hipergeométrica 


() 


(n-4) 


novamente obtém-se o resultado 
k 
P(BIBy) = — = 


Multiplicando ambos os lados da Equação (2.1) por P(F), obtemos 


P(EF) = P(F)P(EIP) (2.2) 


Colocando em palavras, a Equação (2.2) diz que a probabilidade de que Ee F 
ocorram é igual à probabilidade de que F ocorra multiplicada pela probabilida- 
de condicional de E dado que F tenha ocorrido. A Equação (2.2) é muitas vezes 
útil no cálculo da probabilidade da interseção de eventos. 


Exemplo 2e 

Celina está indecisa quanto a fazer uma disciplina de francês ou de química. 
Ela estima que sua probabilidade de conseguir um conceito A seria de 1/2 em 
uma disciplina de francês e de 2/3 em uma disciplina de química. Se Celina 
decide basear a sua escolha no lançamento de uma moeda honesta, qual é a 
probabilidade de que ela obtenha um A em química? 


Solução (a) Suponha que C seja o evento em que Celina faz o curso de qui- 
mica e A o evento em que ela que ela tira A independentemente 
do curso que fizer. Então a probabilidade desejada é P(CA), que 
é calculada usando-se a Equação (2.2) como se segue 


P(CA) = P(OP(AIC) 
o (5) 24 1 
A 5) a = 
Exemplo 2f 


Suponha que uma urna contenha 8 bolas vermelhas e 4 bolas brancas. Reti- 
ramos 2 bolas da urna e não as repomos. (a) Se supomos que em cada retira- 
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da cada bola na urna tenha a mesma probabilidade de ser escolhida, qual é a 
probabilidade de que ambas as bolas retiradas sejam vermelhas? (b) Suponha 
agora que as bolas tenham pesos diferentes, com cada bola vermelha tendo um 
peso r e cada bola branca tendo um peso w. Suponha que a probabilidade de 
que a próxima bola a ser retirada da urna seja igual ao peso da bola dividido 
pela soma dos pesos de todas as bolas na urna naquele momento. Qual é a pro- 
babilidade de que ambas as bolas sejam vermelhas? 


Solução Suponha que R, e R, representem, respectivamente, os eventos em 
que a primeira e a segunda bola sacadas são vermelhas. Agora, dado que a pri- 
meira bola selecionada é vermelha, existem 7 bolas vermelhas e 4 bolas brancas 
restantes, de forma que P(R,|R,) = 7/11. Como P(R,) é claramente 8/12, a pro- 
babilidade desejada é 


P(RiR9) = P(Ry)PCRa|R1) 


<A 2 7N 14 
=()i)= 5 
Naturalmente, essa probabilidade poderia ter sido computada por 
P(RiRo) = (5)/(5). 
Para resolver a letra (b), novamente supomos que R, seja o evento em que 
a i-ésima bola escolhida é vermelha e usamos 


P(R;R) = P(R)P(RIIR,) 


Agora, numere as bolas vermelhas e suponha que B,i = 1,...,8, seja o evento 
em que a primeira bola retirada é uma bola vermelha de número i. Então, 


8 
PR) =PUEB)=5 PB)=85 
i=1 


Além disso, se a primeira bola é vermelha, a urna passa a conter 7 bolas verme- 
lhas e 4 bolas brancas. Assim, por um argumento similar ao precedente, 
r 
P(RoIRy) = >—— 
(RolRa) ML 
Com isso, a probabilidade de que ambas as bolas sejam vermelhas é 
8r Tr 


P(RiR9) = 
(RiRo) 8r + 4w Tr + 4w : a 


Uma generalização da Equação (2.2), a qual fornece uma expressão para a pro- 
babilidade de interseção de um número arbitrário de eventos, é às vezes cha- 
mada de regra da multiplicação. 


A regra da multiplicação 


P(B,E2E3 --- En) = P(Ey)P(Eo ED P(Es| EE) +: P(En|EM + Ena) 
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Para provar a regra da multiplicação, basta aplicar a definição de probabili- 
dade condicional ao lado direito da expressão acima, o que resulta em 
P(E, Eo) P(E,E2E3) P(E, E»: En) 


se TC -PnE E) 


PE E) PE) PE: End) 


Exemplo 2g 
No problema de pareamento discutido no Exemplo 5m do Capítulo 2, mos- 
trou-se que P,, a probabilidade de não haver pareamentos quando N pessoas 


selecionam aleatoriamente chapéus dentre o conjunto formado por seus N cha- 
péus, é dada por 


N 
Pn=) (ii 
i=0 
Qual é a probabilidade de que exatamente k das N pessoas encontrem seus 
chapéus? 


Solução Vamos fixar nossa atenção em um conjunto particular de k pessoas 
e determinar a probabilidade de que esses k indivíduos encontrem os seus cha- 
péus e ninguém mais. Supondo que E represente o evento em que todos neste 
conjunto encontrem os seus chapéus e que G represente o evento em que ne- 
nhuma das outras N — k pessoas encontre o seu chapéu, temos 


P(GE) = P(E)P(GIE) 


Agora, suponha que F, i = 1,..., k, seja o evento em que o i-ésimo membro do 
conjunto encontre o seu chapéu. Então 
P(E) = P(A Fo: Fk) 
= P(Fy) Po FO) PCaF Fo) e PORRA eo FR) 


di dl | 1 
“CNN-1N-2 N-k41 
N-B! 

“NM 


Dado que todos no conjunto de k encontraram os seus chapéus, as outras N 
— k pessoas estarão aleatoriamente escolhendo dentre os seus próprios N — k 
chapéus. Assim, a probabilidade de que nenhum deles encontre o seu chapéu é 
igual à probabilidade de ninguém encontrar seu chapéu em um problema ten- 
do N— k pessoas escolhendo dentre seus próprios N — k chapéus. Portanto, 


N-k 
P(GIE) = Pnk = > (fi! 
i=0 
o que mostra que a probabilidade de um conjunto especificado de k pessoas 
encontrar os seus chapéus e ninguém mais é igual a 
N-— k)! 


P(EG) = Pk 
y 
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Como existirão exatamente k pareamentos se a equação anterior for verdadeira 
para qualquer um dos (1) conjuntos de k indivíduos, a probabilidade desejada é 
P(exatamente k pareamentos) = Py.k/k! 
= e lyk! quando N é grande a 


Vamos agora empregar a regra da multiplicação para obter uma segunda abor- 
dagem de solução para o Exemplo 5h(b) do Capítulo 2. 


Exemplo 2h 
Um baralho comum de 52 cartas é dividido aleatoriamente em 4 pilhas de 13 
cartas cada. Calcule a probabilidade de que cada pilha tenha exatamente um às. 


Solução Defina os eventos E, i = 1,2,3, 4, como se segue: 


E, = (o ás de espadas está em qualquer uma das pilhas) 

E, = (o ás de espadas e o ás de copas estão em pilhas diferentes) 
E, = (os ases de espadas, copas e ouros estão em pilhas diferentes) 
E, = [todos os 4 ases estão em pilhas diferentes) 


A probabilidade desejada é P(E,E,E,E,), e, pela regra da multiplicação, 
P(B,E2E3 Es) = P(E)POo E) P(Es| E, Eo)POE4| E, Eos) 


Agora, 
PE) =1 
já que E, é o espaço amostral S. Também, 
39 
PE) = — 
(BolE1) 51 


já que a pilha contendo o ás de espadas irá receber 12 das 51 cartas restantes, e 
26 
P(Es|E,E3) = — 
(E3|E1 >) 50 


já que as pilhas contendo os ases de espadas e copas irão receber 24 das 50 
cartas restantes. Finalmente, 


13 
P(E4| E, E2E3) = 79 


Portanto, a probabilidade de que cada pilha receba exatamente 1 ás é 
39. 26-13 
51.50.49 
Isto é, existe uma chance de aproximadamente 10,5% de que cada pilha con- 


tenha um ás (o Problema 3.13 fornece uma outra maneira de usar a regra da 
multiplicação para resolver este problema). = 


P(E,E,EsE4) — = 0,105 


Observações: Nossa definição de P(E|F) é consistente com a interpreta- 
ção de probabilidade como sendo uma frequência relativa em uma longa se- 
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quência de experimentos. Para ver isso, suponha que n repetições do experi- 
mento devam ser realizadas, para n grande. Afirmamos que se considerarmos 
apenas os experimentos em que F ocorre, então P(E|F) será, em uma longa 
sequência de experimentos, igual à proporção na qual E também ocorrerá. Para 
verificar essa afirmação, note que, como P(F) é a proporção de experimentos 
nos quais F ocorre a longo prazo, tem-se que, nas n repetições do experimento, 
F ocorrerá nP(F) vezes. Similarmente, em aproximadamente nP(EF) desses 
experimentos, tanto E quanto F irão ocorrer. Com isso, de aproximadamente 
nP(F) experimentos em que F ocorre, a proporção de experimentos em que E 
também ocorre é aproximadamente igual a 


nP(EF)  P(EF) 
nP(P) PF) 


Como essa aproximação se torna exata à medida que n cresce mais e mais, te- 
mos a definição apropriada de P(EI|F). 


3.3 FÓRMULA DE BAYES 


Suponha os eventos E e F. Podemos expressar E como 
E=EFU EF 


pois, para que um resultado esteja em E, ele deve estar em E e Fou em E mas 
não em F (veja a Figura 3.1). Como é claro que EF e EF são mutuamente ex- 
clusivos, temos, pelo Axioma 3, 


P(E) = P(EF) + P(EFº) 
= P(EIF)P(F) + PCEIFS)P(FS) (3.1) 
= P(EIF)P(F) + P(EIFS[ — P(P)] 


A Equação (3.1) diz que a probabilidade do evento E é uma média pondera- 
da da probabilidade condicional de E dado que F ocorreu e da probabilida- 
de condicional de E dado que F não ocorreu — com cada probabilidade con- 
dicional recebendo um maior peso quanto mais provável for a ocorrência do 
evento ao qual está relacionada. Esta fórmula é extremamente útil porque 
seu uso muitas vezes nos permite determinar a probabilidade de um evento 


Figura 3.1 E =EFU EF. EF = Área sombreada; AF = Área tracejada. 
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com base na condição de ocorrência ou não de um segundo evento. Isto é, há 
muitos casos nos quais é difícil calcular diretamente a probabilidade de um 
evento, mas esse cálculo se torna simples se conhecermos a probabilidade de 
ocorrência ou não de um segundo evento. Ilustramos essa ideia com alguns 
exemplos. 


Exemplo 3a (parte 1) 


Uma companhia de seguros acredita que pessoas possam ser divididas em duas 
classes: aquelas que são propensas a acidentes e aquelas que não são. A esta- 
tística da companhia mostra que uma pessoa propensa a acidentes tem pro- 
babilidade de 0,4 de sofrer um acidente dentro de um período fixo de 1 ano, 
enquanto essa probabilidade cai para 0,2 no caso de uma pessoa não propensa 
a acidentes. Se supomos que 30% da população é propensa a acidentes, qual é 
a probabilidade de que um novo segurado sofra um acidente no período de um 
ano posterior à compra de sua apólice? 


Solução Vamos obter a probabilidade desejada primeiro analisando a con- 
dição que diz se o segurado é propenso a acidentes ou não. Suponha que A, 
represente o evento em que o segurado sofrerá um acidente no período de 
um ano após a compra de sua apólice, e que 4 represente o evento em que o 
segurado é propenso a acidentes. Com isso, a probabilidade desejada é dada 
por 


P(As) = PCALAJPÇA) + PrAs | ASPAS) 
= (0,4) (0,3) + (0,2) (0,7) = 0,26 O 


Exemplo 3a (parte 2) 


Suponha que um novo segurado sofra um acidente em menos de um ano após a 
compra da apólice. Qual é a probabilidade de que ele seja propenso a acidentes? 


Solução A probabilidade desejada é 


P(AA 
P(AIAM = Zu 
— PAPCAMIA) 
P(A1) 
“009 6 


0,26 13 [a 


Exemplo 3b 


Considere o seguinte jogo de cartas jogado com um baralho comum de 52 car- 
tas: as cartas são embaralhadas e então viradas uma de cada vez. Em qualquer 
momento, o jogador pode dizer que a próxima carta a ser virada será o ás de 
espadas; se ela o for, então o jogador vence. Além disso, o jogador é considera- 
do vencedor se o ás de espadas não tiver aparecido e restar apenas uma carta, 
desde que nenhuma tentativa de adivinhá-lo tenha sido feita. Qual seria uma 
boa estratégia? Qual seria uma estratégia ruim? 
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Solução Cada estratégia tem uma probabilidade de 1/52 de vencer! Para 
mostrar isso, usaremos a indução para provar o resultado mais forte de que, 
para um baralho com n cartas, uma daquelas cartas é o ás de espadas, e que a 
probabilidade de vitória é de 1/n não importando qual seja a estratégia empre- 
gada. Como isso é claramente verdade para n = 1, suponha que também o seja 
para um baralho com n — 1 cartas, e agora considere um baralho de n cartas. 
Fixe qualquer estratégia e suponha que p represente a probabilidade de que a 
estratégia adivinhe que a primeira carta é o ás de espadas. Dado que ocorra o 
acerto, a probabilidade de o jogador vencer é de 1/n. Se, no entanto, a estratégia 
não adivinhar que a primeira carta é o ás de espadas, então a probabilidade de 
que o jogador vença é igual à probabilidade de que a primeira carta não seja 
o ás de espadas, isto é, (n — 1)/n, multiplicada pela probabilidade condicional 
de vitória dado que a primeira carta não seja o ás de espadas. Mas esta última 
probabilidade condicional é igual à probabilidade de vitória quando se utiliza 
um baralho com n — 1 cartas contendo um único ás de espadas; assim, ela é, pela 
hipótese de indução, igual a 1/(n —1). Com isso, dado que a estratégia não adivi- 

nhe a primeira carta, a probabilidade de vitória é 

n-1 1 1 

nn-1 n 


Assim, supondo que G seja o evento em que a primeira carta é adivinhada, 
obtemos 


Plfvitória) = PfvitórialG]P(G) + P(vitórialG9(1—- P(G)) = -p + -q — p) 
1 
= — E 
n 


Exemplo 3c 


Ao responder uma questão em uma prova de múltipla escolha, um estudante 
sabe a resposta ou a “chuta” Seja p a probabilidade de que o estudante saiba a 
resposta e 1 — p a probabilidade de que ele chute. Suponha que um estudante 
que chuta a resposta tem probabilidade de acerto de 1/m, onde m é o número 
de alternativas em cada questão de múltipla escolha. Qual é a probabilidade 
condicional de que o estudante saiba a resposta de uma questão dado que ele 
ou ela a tenha respondido corretamente? 


Solução Suponha que Ce K representem, respectivamente, o evento em que 
o estudante responde à questão corretamente e o evento em que ele ou ela 
realmente saiba a resposta. Agora, 


P(KC) 


P(KIC) = RG) 


= P(CIK)P(K) 
“— P(CIK)PK) + P(CIK9P(KO) 
EmA a CE ARE o q 
Pp + G/mA — p) 
= mp 
“1+(m-Dp 
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Por exemplo, sem = 5,p = À, então a probabilidade de que o estudante saiba 
a resposta de uma questão que ele ou ela respondeu corretamente é de ê. [a 


Exemplo 3d 


Um exame de sangue feito por um laboratório tem eficiência de 95% na detec- 
ção de certa doença quando ela está de fato presente. Entretanto, o teste tam- 
bém leva a um resultado “falso positivo” em 1% das pessoas saudáveis testadas 
(isto é, se uma pessoa testada for saudável, então, com probabilidade 0,01, o 
teste indicará que ele ou ela tem a doença). Se 0,5% da população realmente 
têm a doença, qual é a probabilidade de que uma pessoa tenha a doença dado 
que o resultado do teste é positivo? 


Solução Suponha que D seja o evento em que a pessoa testada tem a doença e E 
o evento em que o resultado do teste é positivo. A probabilidade desejada é então 
P(DE) 
P(E) 


P(DIE) = 
o P(EID)P(D) 
“ P(EID)P(D) + P(EID9P(DS) 
= (0,95)(0,005) 
— (0,95)(0,005) + (0,01)(0,995) 


95 


Assim, apenas 32% das pessoas cujos exames dão positivo têm de fato a doença. 
Muitos estudantes ficam frequentemente surpresos com esse resultado (eles es- 
peram que a porcentagem sejam muito maior, já que o exame de sangue parece 
ser de boa qualidade), então é provavelmente válido apresentar um segundo 
argumento que, embora seja menos rigoroso que o anterior, é possivelmente 
mais revelador. Faremos isso agora. 

Como 0,5% da população têm de fato a doença, tem-se como consequência 
que, em média, 1 pessoa em cada uma das 200 testadas estará infectada. O teste 
confirmará que essa pessoa tem a doença com uma probabilidade de 0,95. Assim, 
na média, de cada 200 pessoas testadas, o teste confirmará corretamente que 0,95 
pessoas têm a doença. Por outro lado, contudo, das (em média) 199 pessoas sau- 
dáveis, o teste dirá incorretamente que (199)(0,01) dessas pessoas têm a doença. 
Com isso, para cada (,95 pessoas doentes que o teste corretamente apontar como 
doente, existirão (em média) um total de (199)(0,01) pessoas saudáveis que o 
teste incorretamente declarará como doentes. Assim, a proporção de vezes em 
que o resultado está correto ao declarar a pessoa como doente é de 


0,95 95 
0,95 + (199)(0,01) 294 


= 0,323 D 


A Equação (3.1) também é útil quando alguém precisa reavaliar suas pro- 
babilidades pessoais à luz de informações adicionais. Por exemplo, considere os 
exemplos a seguir. 
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Exemplo 3e 


Considere um médico residente ponderando acerca do seguinte dilema: “Se 
estou pelo menos 80% certo de que meu paciente tem essa doença, então 
sempre recomendo cirurgia. Do contrário, se não estiver tão certo, recomen- 
do testes adicionais que são caros e às vezes dolorosos. Como inicialmente 
eu tinha apenas 60% de certeza de que Jonas estava doente, eu pedi o tes- 
te tipo A, que sempre dá um resultado positivo quando o paciente tem a 
doença e quase nunca dá falso positivo. O resultado do teste foi positivo e 
eu estava prestes a recomendar a cirurgia quando Jonas me informou, pela 
primeira vez, que era diabético. A informação complica a questão porque, 
embora não altere a minha estimativa inicial de 60% de chances de ele ter a 
doença em questão, o diabetes altera a interpretação dos resultados do teste 
A. Isso ocorre porque o teste A, embora quase nunca leve a um resultado 
falso positivo, infelizmente dá positivo em 30% dos casos quando o paciente 
é diabético e não sofre da doença em questão. O que faço agora”? Mais testes 
ou cirurgia imediata?” 


Solução Para decidir entre recomendar ou não a cirurgia, o médico deve pri- 
meiro calcular a probabilidade atualizada de que Jonas tenha a doença dado 
que o resultado do teste A tenha sido positivo. Suponha que D represente o 
evento em que Jonas tem a doença e E o evento em que o resultado do teste A 
é positivo. A probabilidade condicional desejada é então 


P(DE) 
P(E) 


P(DIE) = 


o P(D)P(EI|D) 

” P(EIDP(D) + P(EID9P(DS) 
o (0,6)1 

100,6) + (0,3)(0,4) 

= 0,833 


Note que calculamos a probabilidade de um resultado de teste positivo pri- 
meiro usando a condição de que Jonas tem ou não a doença e depois o fato 
de que, como Jonas é diabético, sua probabilidade condicional de receber um 
falso positivo, P(E|D9), é igual a 0,3. Com isso, como o médico tem agora uma 
certeza maior que 80% de que Jonas tem a doença, ele deve recomendar a 
cirurgia. H 


Exemplo 3f 


Em certo estágio de uma investigação criminal, o inspetor encarregado está 
60% convencido da culpa de certo suspeito. Suponha, no entanto, que uma 
nova prova que mostre que o criminoso tinha certa característica (como o fato 
de ser canhoto, careca, ou ter cabelo castanho) apareça. Se 20% da população 
possuem essa característica, quão certo da culpa do suspeito o inspetor estará 
agora se o suspeito apresentar a caraterística em questão? 
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Solução Supondo que G represente o evento em que o suspeito é culpado e 
Co evento em que ele possui a característica do criminoso, temos 


P(GC) 
PC) 


P(GIC) = 


= P(CIG)P(G) 

“ PCIOPO) + PCCIGYP(GS) 
o 1(0,6) 

10,6) + (0,2)(0,4) 

= 0,882 


onde supomos que a probabilidade de o suspeito ter a característica em ques- 
tão mesmo sendo inocente é igual a 0,2, isto é, o percentual da população que 
possui tal característica. nm 


Exemplo 3g 


No campeonato mundial de bridge que ocorreu em Buenos Aires em maio 
de 1965, os famosos parceiros de bridge Terrence Reese e Boris Schapiro 
foram acusados de trapacear utilizando um sistema de sinais com os dedos 
que poderia indicar o número de cartas do naipe de copas que eles tinham. 
Reese e Schapiro negaram a acusação e o caso acabou em uma audiência 
realizada pela liga inglesa de Bridge. A audiência foi feita na forma de um 
julgamento com grupos de acusação e defesa, ambos com o poder de cha- 
mar e arguir as testemunhas. Durante o procedimento em curso, o promotor 
examinou mãos específicas jogadas por Reese e Schapiro e afirmou que suas 
jogadas eram consistentes com a hipótese de eles terem tido conhecimento 
ilícito acerca das cartas do naipe de copas. Neste ponto, o advogado de de- 
fesa disse que as jogadas que eles fizeram eram consistentes com a sua linha 
de jogo usual. Entretanto, o promotor afirmou em seguida que, desde que 
suas jogadas fossem consistentes com a hipótese de culpa, isso deveria ser 
contado como evidência em direção a essa hipótese. O que você pensa do 
raciocínio da acusação? 


Solução O problema consiste basicamente em determinar como a introdu- 
ção de uma nova evidência (no exemplo anterior, a jogada da mão de copas) 
pode afetar a probabilidade de uma hipótese em particular. Se supomos que H 
represente uma hipótese particular (como a hipótese de que Reese e Schapiro 
são culpados) e E a nova evidência, então 


P(HE) 
P(E) 


P(HIE) = 


PE PM) 


E (3.2) 
PEDPGD + PEIHS — POD] 


onde P(H) é nossa avaliação da probabilidade da hipótese da acusação estar 
certa antes da introdução da nova evidência. A nova evidência reforçará a hi- 
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pótese sempre que tornar a hipótese mais provável — isto é, sempre que P(H|E) 
> P(H). Da Equação (3.2), este será o caso sempre que 


P(ElH) = P(ELH)P(H) + P(EIHO = P(M] 
ou, equivalentemente, quando 
P(EIH) = P(EIHO) 

Em outras palavras, qualquer nova evidência pode ser considerada uma ajuda 
para uma hipótese em particular apenas se a sua ocorrência for mais provável 
quando a hipótese for verdadeira do que quando ela for falsa. De fato, a nova 
probabilidade da hipótese depende de sua probabilidade inicial e da relação 
entre essas probabilidades condicionais, já que, da Equação (3.2), 


P(HIE) = PH) 


PES 


PH) + [1 — Pra 


Com isso, no problema em consideração, a jogada realizada pode ser conside- 
rada um reforço para a hipótese de culpa apenas se ela for mais provável caso a 
dupla tenha trapaceado do que do contrário. Como o promotor nunca fez essa 
afirmação, sua declaração de que esta evidência estaria em suporte da hipótese 
de culpa é inválida. E 


Quando o autor deste texto bebe chá gelado em uma cafeteria, ele pede 
um copo de água e um copo de chá de mesmo tamanho. À medida que ele bebe 
o chá, ele preenche continuamente o copo de chá com água. Supondo uma 
mistura perfeita de água e chá, ele pensou a respeito da probabilidade de seu 
último gole ser de chá. Esse pensamento levou à letra (a) do problema a seguir 
e a uma resposta muito interessante. 


Exemplo 3h 


A urna 1 tem inicialmente n moléculas vermelhas e a urna 2 tem n moléculas 
azuis. Moléculas são removidas aleatoriamente da urna 1 da seguinte maneira: 
após cada retirada da urna 1, uma molécula é retirada da urna 2 (se a urna 2 
ainda tiver moléculas) e colocada na urna 1. O processo continua até que todas 
as moléculas tenham sido removidas (assim, existem ao todo 2n retiradas). 


(a) Determine P(R), onde R é o evento em que a última molécula retirada da 
urna 1 é vermelha. 

(b) Repita o problema quando a urna 1 tiver inicialmente r, moléculas ver- 
melhas e b, moléculas azuis e a urna 2 tiver r, moléculas vermelhas e b, 
moléculas azuis. 


Solução (a) Fixe sua atenção em qualquer molécula vermelha em particular 
e suponha que F seja o evento em que essa molécula é a última 
selecionada. Agora, para que F ocorra, a molécula em questão 
ainda deve estar na urna após a remoção das primeiras n molé- 
culas (quando a urna 2 estará vazia). Assim, supondo que N, seja 


96 Probabilidade: Um Curso Moderno com Aplicações 


(b) 


o evento em que essa molécula não seja a i-ésima molécula a ser 
removida, temos 


PP) = P(N,NnF) 
= P(NDP(NaINt) + PCNnINI oo Na DPCFINA o Nn) 
1 11 
(e): 
n n/n 
onde a fórmula anterior usa o fato de que a probabilidade condi- 
cional de que a molécula em consideração é a última molécula a 
ser removida, dado que ela ainda está na urna 1 quando restam 
apenas n moléculas, é, por simetria, 1/n. 
Portanto, se numerarmos as n moléculas vermelhas e fizer- 
mos com que R, represente o evento em que a molécula ver- 


melha de número j é a última molécula removida, então tem-se 
como consequência da fórmula anterior que 


1)" 1 
pap= (1-1) 4 
n n 
Como os eventos R, são mutuamente exclusivos, obtemos 


n n 1 
PR=P[UR|=D PRp=0- se! 
j=1 j=1 


Suponha agora que a urna i tenha inicialmente r, moléculas ver- 
melhas e b; moléculas azuis, para i = 1,2. Para determinar P(R),a 
probabilidade de que a última molécula removida seja vermelha, 
fixe sua atenção em qualquer molécula que esteja inicialmente 
na urna 1. Como na letra (a), tem-se que a probabilidade de que 
esta molécula seja a última a ser removida é 


1 ro+ba Í 
do 
mn + b mn +b 


) ro+ba 


EE é a probabilidade de que a molécula em 


consideração ainda esteja na urna 1 quando a urna 2 se esvaziar, 
e 5; é a probabilidade condicional, dado o evento anterior, de 
que a molécula em consideração seja a última molécula removi- 
da. Com isso, se O é o evento em que a última molécula removi- 
da é uma das moléculas originalmente na urna 1, então 


Isto e(1 meteal 


1 ra+ba 
P(O) = + b =(1—-—— 
(0) = (mn DP ( EE =) 
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Para determinar P(R), usamos a condição de ocorrência de O 
para obter 


P(R) = P(RIOJP(O) + P(RI|OS)P(OS) 


ro+bz 1 r+ba 
ES api (1 EE: ) fadas digito (1 E ) 
n+b mn+b rm + bo n+b 


Ser, t+b,=r,+ b, = n,de modo que ambas as urnas tenham n 
moléculas, então, quando n é grande, 


nm ==: 1, 
e + 
n+b rn + bz 


PL) = (085 = 


A mudança na probabilidade de uma hipótese quando uma nova evidência é 
introduzida pode ser expressada de forma compacta em termos da mudança na 
chance de ocorrência daquela hipótese; o conceito de chance é definido a seguir. 


Definição 
A chance de ocorrência de um evento A é definida como 


P(A) P(A) 
P(A) 1- P(A) 


Isto é, a chance de um evento A diz quão mais provável é a ocorrência 
desse evento do que a sua não ocorrência. Por exemplo, se P(A) = 2/3, 
então P(A) = 2P(A9); com isso, a chance de ocorrência de A é igual a 2. Se 
a chance de ocorrência é igual a a, então é comum dizer que a chance é de 


“a para 1” a favor da hipótese. 


Considere agora uma hipótese H que é verdadeira com probabilidade P(H) 
e suponha que a nova evidência E seja introduzida. Então, as probabilidades 
condicionais, dada a evidência E, de que a hipótese H seja verdadeira ou de que 
essa hipótese H não seja verdadeira, são dadas respectivamente por 
P(EIB)P(H) P(EIBSP(HS) 


Portanto, a nova chance de ocorrência de H após a introdução da evidência E 
é dada por 


PE) PH PEIH) 
PSIE) PHS PEIHOS 


(3.3) 


Isto é, o novo valor da chance de ocorrência de H é igual ao valor antigo mul- 
tiplicado pela relação entre a probabilidade condicional da nova evidência 
dado que a hipótese H é verdadeira e a probabilidade condicional dado que 
a hipótese H não é verdadeira. Assim, a Equação (3.3) verifica o resultado do 
Exemplo 3f. Isto porque a chance de ocorrência de H e por conseguinte a sua 
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probabilidade de ocorrência aumentam sempre que a nova evidência for mais 
provável quando a hipótese H for verdadeira do que do contrário. Similarmen- 
te, as chances diminuem sempre que a nova evidência for mais provável quan- 
do H for falso do que do contrário. 


Exemplo 3i 


Uma urna contém duas moedas do tipo 4 e uma moeda do tipo B. Quando 
uma moeda A é lançada, ela tem probabilidade de 1/4 de dar cara. Por outro 
lado, quando uma moeda B é lançada, ela tem probabilidade de 3/4 de dar cara. 
Uma moeda é sorteada aleatoriamente e lançada. Dado que a moeda deu cara, 
qual é a probabilidade de que a moeda seja do tipo 4? 


Solução Suponha que A seja o evento correspondente ao lançamento de uma 
moeda de tipo 4,e que B = A“ seja o evento correspondente ao lançamento de 
uma moeda de tipo B. Queremos calcular P(Alcara), onde cara corresponde ao 
evento em que a moeda lançada dá cara. Da Equação (3.3), vemos que 
P(Alcara) P(A) P(caralA) 
P(Acjcara) P(B) PlcaralB) 
2/3 1/4 
“1/3 3/4 
=2/3 


Portanto, as chances são de 2/3: 1, ou, equivalentemente, a probabilidade de que 
uma moeda do tipo A tenha sido jogada é de 2/5. E 


A Equação (3.1) pode ser generalizada da seguinte maneira: suponha que 
F,, E,,...,F, sejam eventos mutuamente exclusivos tais que 


n 
Us =S 


Em outras palavras, exatamente um dos eventos F,, F,,..., F, deve ocorrer. Es- 
crevendo 


e usando o fato de que os eventos EF, i = 1,...,n, são mutuamente exclusivos, 
obtemos 


P(E) => PER) 


i=1 
= 53 PEIFRP(Fi (3.4) 
i=1 


Assim, a Equação (3.4) mostra, para dados eventos F,, F,,..., F,, dos quais um e 
apenas um deve ocorrer, como podemos calcular P(E) primeiro analisando as 
condições em que F, ocorre. Isto é, a Equação (3.4) diz que P(E) é igual à média 
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ponderada de P(ElF,), com cada termo sendo ponderado pela probabilidade do 
evento ao qual está condicionado. 


Exemplo 3j 


No Exemplo 5j do Capítulo 2, analisamos a probabilidade de, em um baralho 
embaralhado aleatoriamente, a carta retirada logo após o primeiro ás ser algu- 
ma carta específica. Além disso, fornecemos um argumento baseado em análise 
combinatória para mostrar que essa probabilidade é de 1/52. Temos agora um 
argumento probabilístico baseado na análise condicional: seja E o evento em 
que a carta logo após o primeiro ás é alguma carta específica, digamos, a carta x. 
Para calcular P(E), ignoramos a carta x e analisamos as condições referentes à 
ordenação relativa das outras 51 cartas no baralho. Supondo que O represente 
a ordenação, temos 


P(B) = > PEIO)P(O) 
0) 


Agora, dado O, existem 52 possíveis ordenações para as cartas correspondendo 
a ter a carta x como a i-ésima carta do baralho, i = 1,2,..., 52. Mas, como todas as 
52! ordenações possíveis eram de início igualmente prováveis, tem-se como conse- 
quência que, tendo O como condição, cada uma das 52 ordenações remanescentes 
são igualmente prováveis. Como a carta x virá logo após o primeiro ás em apenas 
uma dessas ordenações, temos P(E|O) = 1/52, o que implica P(E) = 1/52. E 


Novamente, suponha que F,, F,,..., F, seja um conjunto de eventos mutua- 
mente exclusivos e exaustivos (o que significa que exatamente um desses even- 
tos deve ocorrer). 

Suponha também que E tenha ocorrido e que estejamos interessados em 
determinar qual dos F, eventos ocorreu. Então, pela Equação (3.4), temos a 
proposição a seguir. 

Proposição 3.1 
P(F, Ee 
(BIE) = PE) 
— PEEPE) 


> PCEIFDPCFo 
i=1 (3.5) 


A Equação (3.5) é conhecida como fórmula de Bayes, em homenagem ao filó- 
sofo inglês Thomas Bayes. Se pensarmos nos eventos F, como sendo “hipóte- 
ses” possíveis sobre algo, então a fórmula de Bayes pode ser interpretada como 
se mostrasse como as opiniões que se tinha a respeito dessas hipóteses antes da 
realização do experimento [isto é, P(F;)] deveriam ser modificadas pela evidên- 
cia produzida pelo experimento. 


Exemplo 3k 


Um avião desapareceu e presume-se que seja igualmente provável que ele tenha 
caído em qualquer uma de 3 regiões possíveis. Suponha que 1 — B,i = 1,2,3, 
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represente a probabilidade de que o avião seja encontrado após uma busca na i- 
ésima região quando o avião está de fato naquela região (as constantes f, são cha- 
madas de probabilidades de negligência, porque elas representam a probabilidade 
de não se encontrar o avião; elas são em geral atribuídas às condições geográficas e 
ambientais da região). Qual é a probabilidade condicional de que o avião esteja na 
i-ésima região dado que a busca na região 1 tenha sido malsucedida? 


Solução Suponha que R,i = 1,2,3 seja o evento em que o avião está na re- 
gião ie E o evento em que a busca na região 1 é malsucedida. Da fórmula de 
Bayes, obtemos 


P(ER|) 
P(E) 
P(EIRDP(RI) 
3 

> PCEIRDP(RO 


i=1 


P(RilE) = 


E (Br) 

(BA + (Di + (Di 
as B1 

Bi +42 


Paraj = 2,3, 

P(EIRDP(R;) 
P(E) 

O 0% 

“Gui+ri+i 


1 
E 6) 
Bi +2 ) 


P(RjIE) = 


Note que a probabilidade atualizada (isto é, a probabilidade condicional) 
de o avião estar na região j, dada a informação de que a busca na região 1 não 
o encontrou, é maior que a probabilidade inicial de que ele estivesse na região 
j quando j * 1 e menor que a probabilidade quando j =1. Essa afirmação é 
certamente intuitiva, já que não encontrar o avião na região 1 pareceria dimi- 
nuir as chances de o avião estar naquela região e aumentar as chances de ele 
estar em outra região. Além disso, a probabilidade condicional de o avião estar 
na região 1 dada a busca malsucedida naquela região é uma função crescente 
da probabilidade de negligência /3,. Essa afirmação também é intuitiva, já que, 
quanto maior f,, mais razoável é atribuir o fracasso da busca à “má sorte” do 
que à possibilidade de o avião não estar lá. Similarmente, P(RJE),j * 1, é uma 
função decrescente de B,. 

O próximo exemplo tem sido utilizado com frequência por estudantes de 
probabilidade inescrupulosos para ganhar dinheiro de seus amigos menos es- 
pertos. 
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Exemplo 31 


Suponha que tenhamos 3 cartas idênticas, exceto que ambos os lados da pri- 
meira carta são vermelhos, ambos os lados da segunda carta são pretos e um 
dos lados da terceira carta é vermelho enquanto o outro lado é preto. As três 
cartas são misturadas no interior de um boné; uma carta é selecionada aleato- 
riamente e colocada no chão. Se o lado de cima da carta escolhida é vermelho, 
qual é a probabilidade de que o outro lado seja preto? 


Solução Suponha que RR, BB e RB representem, respectivamente, os even- 
tos em que a carta escolhida é toda vermelha, toda preta ou vermelha e preta. 
Além disso, suponha que R seja o evento em que o lado de cima da carta sorte- 
ada tem cor vermelha. Então, a probabilidade desejada é obtida por 
P(RBNR) 
P(RBIR) = PR) 
P(RIRB)P(RB) 
— P(RIRR)P(RR) + P(RIRB)P(RB) + P(RIBB)P(BB) 


(3) 6) 


Portanto, a resposta é 1/3. Alguns estudantes acham que 1/2 é a resposta porque 
pensam incorretamente que, dado que um lado vermelho apareça, haverá duas 
possibilidades igualmente prováveis: de que a carta seja toda vermelha ou que 
seja vermelha e preta. Seu erro, contudo, está em supor que essas duas possi- 
bilidades sejam igualmente prováveis. Pois, se pensarmos em cada carta como 
sendo formada por dois lados distintos, então veremos que existem 6 resultados 
igualmente prováveis para o experimento - isto é, R,, R,, B,, B,, Rs, B, — onde 
o resultado é igual a R, se o primeiro lado da carta vermelha for virado para 
cima, R, se o segundo lado da carta vermelha for virado para cima, R, se o lado 
vermelho da carta vermelha e preta for virado para cima, e assim por diante. 
Como o outro lado da carta com lado vermelho virado para cima será preto 
somente se o resultado for R,, vemos que a probabilidade desejada é a proba- 
bilidade condicional de R, dado que R, ou R, ou R, tenham ocorrido, o que é 
obviamente igual a 1/3. E 


Exemplo 3m 


Um novo casal, que tem duas crianças, acabou de se mudar para a cidade. Su- 
ponha que a mãe seja vista caminhando com uma de suas crianças. Se esta 
criança é uma menina, qual é a probabilidade de que ambas as crianças sejam 
meninas? 


Solução Comecemos definindo os seguintes eventos: 


G,: a primeira criança (isto é, a criança mais velha) é uma menina. 
G,: a segunda criança é uma menina. 
G: a criança vista com a mãe é uma menina. 
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Além disso, suponha que B,, B, e B representem eventos similares, exceto 
que agora o substantivo “menina” seja trocado por “menino” Agora, a probabi- 
lidade desejada é P(G,G,|G), o que pode ser escrito como se segue 


P(G1G3G 

P(G1G.16) = EA 
— P(G16)) 
— PG) 


Também, 
P(G) = P(G|G1G2)P(G1G2) + P(G|G1B2)P(G1B>) 
+ P(G|B1G2)P(B1G2) + P(GI|B1B2)P(B1,B2) 
= P(G1G2) + P(G|G1B2)P(G1B>) + P(G|B,G>)P(B1G2) 


onde a última equação fez uso dos resultados P(G|G,G,) = 1e P(G|B,B,) = 0. 
Se agora fazemos a suposição usual de que as quatro possibilidades de gênero 
são igualmente prováveis, então vemos que 
1 
P(G1G2]6) = >> TÉ E ——— 
a + P(G|G1B2)/4 + P(G|B1G3)/4 
1 
“1 + P(G|G,B2) + P(GIB1G>) 


Assim, a resposta depende das suposições que queremos fazer a respeito das 
probabilidades condicionais de que a criança vista com a mãe é uma menina 
dado o evento G,B, e de que a criança vista com a mãe é uma menina dado o 
evento G,B,. Por exemplo, se quisermos supor, por um lado, que, independen- 
temente do sexo das crianças, a criança caminhando ao lado da mãe é a mais 
velha com certa probabilidade p, então teremos que 


P(G|G1B2)) =p =1 — P(G|B1Go) 
o que implica, neste cenário, que 


1 
P(G1Gal6) = 3 


Se, por outro lado, supormos que, se as crianças tiverem sexos diferentes, então 
a mãe escolheria caminhar com a menina com probabilidade q, independente- 
mente da ordem do nascimento das crianças, então teríamos 


P(G|G1B>) = P(GI|B1G2) = q 
o que implica 


P(G1Ga]G) = 1424 


Por exemplo, se fizermos q = 1, significando que a mãe devesse sempre esco- 
lher caminhar com uma filha, então a probabilidade condicional de que ela 
tivesse duas filhas seria igual a 1/3, o que está de acordo com o Exemplo 2b 
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porque ver a mãe com uma filha é agora equivalente ao evento em que ela tem 
pelo menos uma filha. 

Com isso, como se vê, é impossível obter uma solução para esse problema. 
De fato, mesmo quando a suposição usual de que as crianças tenham a mesma 
probabilidade de ser menino ou menina é feita, precisamos ainda realizar su- 
posições adicionais antes que uma solução possa ser dada. Isso ocorre porque o 
espaço amostral de nosso experimento é formado por vetores na forma s,, s,, i, 
onde s, é sexo da criança mais velha, s, é o sexo da criança mais nova, e i iden- 
tifica a ordem de nascimento da criança vista com a mãe. Como resultado, para 
especificar as probabilidades dos eventos do espaço amostral, não é suficiente 
fazer suposições apenas sobre o sexo das crianças; também é necessário supor 
algo sobre as probabilidades condicionais a respeito de qual criança está com a 
mãe dado o sexo das crianças. m 


Exemplo 3n 


Uma caixa contém 3 tipos de lanternas descartáveis. A probabilidade de que 
uma lanterna do tipo 1 funcione por mais de 100 horas é igual a 0,7, e as proba- 
bilidades referentes às lanternas de tipo 2 e 3 correspondem, respectivamente, 
a 0,4 e 0,3. Suponha que 20% das lanternas na caixa sejam do tipo 1,30% sejam 
do tipo 2, e 50% sejam do tipo 3. 


(a) Qual é a probabilidade de que uma lanterna aleatoriamente escolhida 
funcione mais que 100 horas? 

(b) Dado que uma lanterna tenha durado mais de 100 horas, qual é a proba- 
bilidade condicional de que ela seja uma lanterna do tipo j,j = 1,2,3? 


Solução (a) Suponha que A represente o evento em que a lanterna escolhida 
funcione mais de 100 horas, e F, o evento em que uma lanterna 
do tipo j seja escolhida, ; = 1,2,3. Para calcular P(A), analisamos 
a condição referente ao tipo da lanterna e obtemos 

P(A) = P(AIF)P(F,) + P(ALF)P(F) + P(ALF)PCE,) 
= (0,7)(0,2) + (0,4)(0,3) + (0,3)(0,5) = 0,41 


Há 41% de chance de a lanterna funcionar por mais de 100 horas. 


(b) A probabilidade é obtida usando-se a fórmula de Bayes 
P(AF) 
PCFIA) = 
(FA) P(A) 
— PAP; 
04 


Assim, 
P(FA) = (0,7)(0,2)/0,41 = 14/41 
P(BJA) = (0,4)(0,3)/0,41 = 12/41 
P(FJA) = (0,3)(0,5)/0,41 = 15/41 


Por exemplo, enquanto a probabilidade de uma lanterna do tipo 
1 ser escolhida é de apenas 0,2, a informação de que a lanterna 
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funcionou por mais de 100 horas aumenta a probabilidade desse 
evento para 14/41 = 0,341. [n 


Exemplo 30 


Um crime foi cometido por um único indivíduo, que deixou algumas amostras 
de seu DNA na cena do crime. Peritos que estudaram o DNA recuperado no- 
taram que apenas 5 cadeias puderam ser identificadas, e que uma pessoa ino- 
cente teria uma probabilidade de 10” de ter seu DNA compatível com todas as 
cadeias recuperadas. O promotor do distrito imagina que o criminoso pode ser 
qualquer um dos 1 milhão de habitantes da cidade. Dez mil desses residentes 
foram libertados da prisão ao longo dos últimos 10 anos; consequentemente, 
tem-se arquivada uma amostra de seu DNA. Antes de verificar os arquivos de 
DNA, o promotor do distrito acha que cada um dos dez mil ex-criminosos tem 
probabilidade a de ter cometido o novo crime, enquanto cada um dos 990.000 
moradores restantes tem probabilidade £, onde a = cf3 (isto é,o promotor su- 
põe que cada condenado recém-libertado é c vezes mais propenso a cometer 
um crime do que um morador da cidade que não seja um condenado recém- 
libertado). Quando o DNA analisado é comparado com a base de dados dos 
dez mil ex-condenados, descobre-se que A. J. Jones é o único cujo DNA é com- 
patível com a amostra coletada. Supondo que a estimativa entre a« e £ feita 
pelo promotor da cidade seja precisa, qual é a probabilidade de que A. J. seja 
o culpado? 


Solução Para começar, como a soma das probabilidades deve ser igual a 1, 
temos 


1 = 10.0000 + 990.0008 = (10.000c + 990.000)8 
Assim, 


1 c 
= 10.000c + 990.000" “= 10.000c + 990.000 


B 


Agora, suponha que G seja o evento em que A. J. é culpado, e M o evento em 
que A. J. é o único entre as dez mil pessoas no arquivo a ter o DNA compatível 
com os vestígios encontrados no local do crime. Então 


P(GM) 


P(GIM) = PM) 


" PGP(MIG) 
— P(MIG)P(G) + P(MIGIP(GS) 


Por outro lado, se A. J. é o culpado, então ele será o único a ter seu DNA com- 
patível se nenhum dos outros no arquivo tiver seu DNA compatível. Portanto 


PMIG = (1 — 10) 


Por outro lado, se A. J. é inocente, então, para que ele seja o único com o DNA 
compatível, seu DNA deve ser compatível (o que ocorrerá com probabilidade 
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10), todos os outros na base de dados devem ser inocentes, e nenhum destes 
outros pode ter DNA compatível com os vestígios encontrados no local do cri- 
me. Agora, dado que A. J. é inocente, a probabilidade condicional de que todos 
os outros na base de dados também sejam inocentes é 
P(todos na 
base de dados inocentes) 
P(A.J. inocente) 
1 — 10.0000 
Ê l-—-a 


P(todos os demais inocentes|A. J. inocente) = 


Além disso, a probabilidade condicional de que nenhum dos outros na base de 
dados tenha DNA compatível com os vestígios encontrados, dada a sua inocên- 
cia, é de (1 — 10) Portanto, 


P(MIGS) = 10% (2) a — 105) 
l-a 


Como P(G) = «,a fórmula anterior resulta em 


a 1 
P(GM = ———>————— E — 
UR a + 10-51 — 10.0000) 0,9 + 10rº 
Assim, se a impressão inicial do promotor do distrito fosse de que qualquer ex- 
condenado tivesse probabilidade 100 vezes maior de cometer o crime do que 
um não condenado (isto é, c = 100), então a = 1/19.900 e 


P(GIM) = = 0,9099 


1 
1,099 
Se o promotor do distrito tivesse imaginado inicialmente que a relação apro- 
priada seria c = 10, então a = 1/109.000 e 


1 
P(GIM) = 199 = 0,5025 


Se o promotor do distrito tivesse imaginado inicialmente que o criminoso pu- 
desse, com a mesma probabilidade, ser qualquer um dos moradores da cidade 
(c = 1), então a = 10 “e 

1 


P(GIM) = 109 


= 0,0917 


Assim, a probabilidade varia de aproximadamente 9%, quando a suposição 
inicial do promotor do distrito é a de que todos os membros da população têm 
a mesma chance de ser o criminoso, até 91%, quando ele supõe que cada ex- 
condenado tem probabilidade 100 vezes maior de ser o criminoso do que uma 
pessoa que não tenha sido condenada anteriormente. E 
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3.4 EVENTOS INDEPENDENTES 


Os exemplos anteriores deste capítulo mostram que P(E|F), a probabilidade con- 
dicional de E dado F, não é geralmente igual a P(E), a probabilidade incondicio- 
nal de E. Em outras palavras, o conhecimento de que F ocorreu geralmente muda 
a chance de ocorrência de E. Nos casos especiais em que P(ElF) é de fato igual 
a P(E), dizemos que E é independente de F. Isto é, E é independente de F se o 
conhecimento de que F ocorreu não mudar a probabilidade de ocorrência de E. 

Como P(EI|F) = P(EF)/P(F), tem-se a condição em que E é independente 
de Fse 


P(EF) = P(E)P(F) (4.1) 


O fato de a Equação (4.4) ser simétrica em E e F mostra que sempre que E 
for independente de F, F também será independente de E. Temos portanto a 
definição a seguir. 


Definição 


Dois eventos E e F são chamados de independentes se a Equação (4.1) for 


verdadeira. 
Dois eventos E e F que não são independentes são chamados de dependentes. 


Exemplo 4a 
Uma carta é selecionada aleatoriamente de um baralho comum de 52 cartas. Se 
E é o evento em que a carta selecionada é um ás e F é o evento em que a carta 


selecionada é do naipe de espadas, então E e F são independentes. Isso ocorre 
porque P(EF) = 1/52, enquanto P(E) = 4/52 e P(F) = 13/52. D 


Exemplo 4b 


Duas moedas são lançadas e supõe-se que os 4 resultados possíveis sejam igual- 
mente prováveis. Se E é o evento em que a primeira moeda dá cara e Fo evento 
em que a segunda moeda dá coroa, então E e F são independentes, pois P(EF) 
= P([(cara, coroa))) = 1/4, enquanto P(E) = P(((cara, cara), (cara, coroa))) = 
1/2 e P(F) = P(((cara, coroa), (coroa, coroa)]) = 1/2. D 


Exemplo 4c 


Suponha que joguemos 2 dados honestos. Seja E, o evento em que a suma dos 
dados é igual a 6e Fo evento em que o primeiro dado é igual a 4. Então, 


1 
PED) = P(A, 9) = 55 


5N/1 5 
P(EDP(P) = (55) (5) = E 


enquanto que 
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Com isso, E, e F não são independentes. Intuitivamente, a razão para isso é cla- 
ra. Isto porque, se estamos interessados na probabilidade de obter um 6 (com 2 
dados), devemos ficar bastante contentes se o primeiro dado cair no 4 (ou, de 
fato, em qualquer um dos números 1,2,3,4e 5), pois com isso ainda teremos a 
probabilidade de conseguir um total de 6. Se, no entanto, o primeiro dado cair no 
6, ficaremos tristes porque perderíamos a chance de conseguir um total de 6 com 
os dois dados. Em outras palavras, nossa chance de obter um total de 6 depende 
do resultado do primeiro dado; assim, E, e F não podem ser independentes. 

Agora, suponha que E, seja o evento em que a soma dos dados é igual a 7 
E,e F são independentes? A resposta é sim, já que 


1 
P(EaF) = P((4,3)) = 52 


EE (5) (5) E (55) 


Deixamos para o leitor a apresentação do argumento intuitivo do porquê do 
evento em que a soma dos dados é igual a 7 ser independente do resultado do 
primeiro dado. E 


enquanto que 


Exemplo 4d 


Se E representar o evento em que o próximo presidente dos EUA é republi- 
cano e F o evento em que um grande terremoto ocorrerá no período de um 
ano, então a maioria das pessoas provavelmente tenderia a supor que E e F 
são independentes. Entretanto, possivelmente haveria alguma controvérsia se 
E fosse considerado independente de G, onde G é o evento que representa a 
ocorrência de recessão no período de dois anos após a eleição. E 


Mostramos agora que, se E é independente de F, então E também é inde- 
pendente de Fº. 


Proposição 4.1 Se Ee Fsão independentes, então E e Fº também o são. 


Demonstração Suponha que E e F sejam independentes. Como E = EF 
U EF ,e é obvio que EF e EF são mutuamente exclusivos, temos 


P(E) = P(EF) + P(EFS) 
= PD P(P) + P(EFS 
ou, equivalentemente, 
P(EF9 = PB — PP) 
= P(E)P(FS) 


e o resultado está provado. U 


Assim, se E é independente de F, a probabilidade da ocorrência de E não 
muda se F tiver ocorrido ou não. 
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Suponha agora que E seja independente de Fe também de G. O evento E 
é nesse caso necessariamente independente de FG? A resposta, de certo modo 
surpreendente, é não, como demonstra o exemplo a seguir. 


Exemplo 4e 


Dois dados honestos são lançados. Seja E o evento em que a soma dos dados é 
igual a 7 Fo evento em que o primeiro dado é igual a 4e G o evento em que o 
segundo dado é igual a 3. Do Exemplo 4c, sabemos que E é independente de F, 
e a aplicação do mesmo raciocínio aqui mostra que E também é independente 
de G; mas, claramente, E não é independente de FG [já que P(EIFG) = 1]. E 


Parece uma consequência do Exemplo 4e o fato de uma definição apropria- 
da da independência de três eventos E, Fe G ter que ir além da mera suposição 


3 Grs : 
de que todos os 2 )pares de eventos sejam independentes. Somos assim leva- 


dos à seguinte definição. 


Definição 


Três eventos E, Fe G são ditos independentes se 
P(EFO) = PB) P(P)P(G) 
P(EF) = P(E)P(F) 
P(EG) = P(EJP(G) 
P(FG) = P(F)P(G) 


Note que, se E, Fe G são independentes, então E será independente de 
qualquer evento formado a partir de Fe G. Por exemplo, E é independente de 
FU G,já que 

P[E(F U G)]=P(EFU EG) 
= P(EF) + P(EG) — P(EFG) 
= PBP + P(B)P(G) — P(BJP(FG) 
= P(EJP(F) + P(G) — P(FG)] 
= P(BJP(F U 6) 
Naturalmente, também podemos estender a definição de independência a mais 


de três eventos. Os eventos E,, E,,..., E, são ditos independentes se, para cada 
subconjunto E,,, E,.,..., E,. desses eventos, r = n, 


P(ErE> --- Ev) = P(Ey)PCEo) --: P(Er) 


Finalmente, definimos um conjunto infinito de eventos como sendo indepen- 
dente se cada subconjunto finito desses eventos for independente. 
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Às vezes, um experimento de probabilidade consiste em realizar uma 
sequência de subexperimentos. Por exemplo, se um experimento consiste 
em lançar uma moeda continuamente, podemos pensar em cada lançamen- 
to como sendo um subexperimento. Em muitos casos, é razoável supor que 
os resultados de qualquer grupo de subexperimentos não tenham efeito nas 
probabilidades associadas aos resultados dos outros experimentos. Se esse é 
o caso, dizemos que os subexperimentos são independentes. Mais formalmen- 
te, dizemos que os subexperimentos são independentes se E,, E,,..., E,,... É 
necessariamente uma sequência independente de eventos sempre que E, for 
um evento cuja ocorrência é completamente determinada pelo resultado do 
i-ésimo subexperimento. 

Se cada subexperimento tem o mesmo conjunto de resultados possíveis, 
então os subexperimentos são frequentemente chamados de tentativas. 


Exemplo 4f 

Deve-se realizar uma sequência infinita de tentativas independentes. Cada ten- 
tativa tem probabilidade de sucesso p e probabilidade de fracasso 1 — p. Qual é 
a probabilidade de que 


(a) pelo menos 1 sucesso ocorra nas primeiras n tentativas; 
(b) exatamente k sucessos ocorram nas primeiras n tentativas; 
(c) todas as tentativas resultem em sucessos? 


Solução Para determinar a probabilidade de pelo menos 1 sucesso nas pri- 
meiras n tentativas, é mais fácil calcular primeiro a probabilidade do evento 
complementar de que nenhum sucesso ocorra nas primeiras n tentativas. Se E, 
representar o evento fracasso na i-ésima tentativa, então a probabilidade de 
não haver eventos bem-sucedidos é, por independência, 


P(E1 E, --- En) = P(Ey)P(E2)---P(En) = (1 — pj 
Portanto, a resposta da letra (a) é1 - (1 - p)”. 
Para computar a resposta da letra (b), considere qualquer sequência parti- 


cular em que os primeiros n resultados contenham k sucessos e n — k fracassos. 
Cada uma dessas sequências, pela hipótese de independência das tentativas, irá 


ocorrer com probabilidade p*(1 — p)"*. Como existem o sequências como 
essa [há n!/k!(n — k)! permutações de k sucessos e n — k fracassos], a probabili- 
dade desejada na letra (b) é 


P[exatamente k sucessos) = ( ja ) pa — pt 


Para responder à letra (c), notamos, pela letra (a), que a probabilidade de 
que as primeiras n tentativas resultem em sucesso é dada por 


P(E(E;-- E) =p” 
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Assim, usando a propriedade da continuidade das probabilidades (Seção 2.6), 
vemos que a probabilidade desejada é dada por 


oo n 
dá (Orcs fd PQ 
n oo 
i=1 i=1 


n 
a 1 Cc 
i=1 
nono |JOsep<1 
A a Da " 


Exemplo 4g 
Um sistema formado por n diferentes componentes é chamado de sistema pa- 
ralelo se ele funcionar quando pelo menos um dos componentes estiver fun- 
cionando (veja Figura 3.2). Em um sistema como esse, se o componente i, que 
é independente dos demais componentes, funcionar com probabilidade p, i = 
1,...,n, qual é a probabilidade do sistema funcionar? 
Solução Seja A,o evento em que o componente i funciona. Então 

P(sistema funciona) = 1 — P(sistema não funciona) 

= 1 — P(nenhum componente funciona) 


=1-PI(JA 
i 
n 
=1 — Ia — Di) por independência E 
i=1 


Exemplo 4h 


Realizam-se tentativas independentes que consistem no lançamento de um par 
de dados honestos. Qual é a probabilidade de que um resultado igual a 5 apa- 
reça antes de um resultado igual a 7 quando o resultado de uma jogada é igual 
à soma dos dados? 


1 . 
2 
A B 
3 
n 


Figura 3.2 Sistema paralelo: funciona se a corrente fluir de A para B. 
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Solução Se E, representar o evento em que o 5 ou o 7 não aparecem nas 
primeiras n — 1 tentativas e um 5 aparece na n-ésima tentativa, então a proba- 
bilidade desejada é 


oo oo 
P(HJE|= > P(En) 
n=1 n=1 


Agora, como Pf5 em qualquer tentativa) = 4/36 e P(7 em qualquer tentativa) = 
6/36, obtemos, pela independência das tentativas, 


n-1 
PE) = (1 a 5) Ei 


36 36 
Assim, 
e Leda 
El=s Ee 
P[U Ex 55 (53) 
n=1 n=1 
1a 
9 13 
91 - E 
2 


Esse resultado também poderia ter sido obtido pelo uso das probabilidades 
condicionais. Se E for o evento em que um 5 ocorre antes de um 7 então pode- 
mos obter a probabilidade desejada, P(E), impondo uma condição em relação 
ao resultado da primeira tentativa. Isso é feito da seguinte maneira: suponha 
que E seja o evento em que a primeira tentativa resulta em um 5, G o evento 
em que a primeira tentativa resulta em um 7 e H o evento em que a primeira, 
tentativa não resulta nem em um 5, nem em um 7. Então, condicionando em 
qual desses eventos ocorre, temos 


P(E) = P(EIF)P(P) + P(EIG)P(G) + PCEIH)P(H) 


Entretanto, 
P(EIF) = 1 
P(E|G) = 0 
P(EIH) = P(E) 


As duas primeiras igualdades são óbvias. A terceira ocorre porque se o primeiro 
resultado não levar nem a um 5 nem a um 7 então naquele ponto a situação será 
exatamente igual àquela que se tinha no início do problema — isto é, a pessoa 
responsável pelo experimento continuará a rolar um par de dados honestos até 
que um 5 ou um 7 apareça. Além disso, as tentativas são independentes; portan- 
to, o resultado da primeira tentativa não terá efeito em lançamentos subsequen- 
tes dos dados. Como P(F) = 4/36, P(G) = 6/36 e P(H) = 26/36, tem-se que 


1 13 
PB = + HE 
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ou 
2 
PE) = = 
E) => 


O leitor deve notar que a resposta é bastante intuitiva. Isto é, como um 5 
tem probabilidade de 4/36 de aparecer em cada jogada, e um 7 tem probabili- 
dade de 6/36, parece intuitivo que a chance de um 5 aparecer antes de um 7 seja 
de 4 para 6. A probabilidade deve então ser 4/10, como de fato o é. 

O mesmo argumento mostra que, se E e F são eventos mutuamente exclusi- 
vos de um experimento, então, quando tentativas independentes do experimen- 
to forem realizadas, o evento E ocorrerá antes do evento F com probabilidade 

PE) 


PE) + P(F) 


Exemplo 4i 
Há cupons de desconto de n tipos, e cada novo cupom é recolhido com probabi- 
lidade p, >; pi = 1, independentemente de seu tipo i. Suponha que k cupons 
devam ser recolhidos. Se A, é o evento em que há pelo menos um cupom de 
tipo i entre aqueles recolhidos, então, para i = j, determine 
(a) P(A) 
(b) PAU A) 
(c) P(4JA,) 
Solução 
 P(A)=1-— PAS 
=1 — P(nenhum cupom é do tipo i) 
=1-(1— pf 
onde o desenvolvimento anterior usou o fato de cada cupom não ser do tipo i 
com probabilidade 1 — p,. Similarmente, 


P(A; U A; =1— P(A; U AD) 
=1 — Pfnenhum cupom é do tipo i ou j) 
== pi sp 
onde o desenvolvimento anterior usou o fato de cada cupom não ser nem do 


tipo i, nem do tipo j com probabilidade 1 - p;— p.. 
Para determinar P(AJA,), vamos usar a identidade 


P(A; U A) = P(A) + P(A) — P(A;A;) 
que, juntamente com as letras (a) e (b), resulta em 
PAsp=1-d-pt+1-d-pf-N- dp pf 
=1-d-pt-d-pf+a-p pf 
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Consequentemente, 
PAA) 1--p*-dA-pf+Ga-p — pp 
P(A;|A;) = = E E 
P(A;) 1-1 -pj) 


O exemplo a seguir apresenta um problema que ocupa um lugar honrado 
na história da teoria da probabilidade. Este é o famoso problema dos pontos. 
Em termos gerais, o problema é este: dois jogadores fazem uma aposta e dispu- 
tam um jogo, com a aposta indo para o vencedor da disputa. Algo requer que 
eles interrompam o jogo antes que alguém o tenha vencido, mas no momento 
da interrupção cada um dos jogadores já tinha algum tipo de “pontuação par- 
cial”? Como deveria ser dividida a aposta? 

Esse problema foi proposto ao matemático francês Blaise Pascal em 1654 
pelo Chevalier de Méré, que era um jogador profissional naquela época. Ao ata- 
car o problema, Pascal introduziu a importante idéia de que a proporção do 
prêmio merecida pelos competidores deveria depender de suas respectivas pro- 
babilidades de vencer o jogo caso o jogo fosse recomeçado a partir daquele pon- 
to. Pascal obteve alguns casos especiais e, mais importantemente, iniciou uma 
correspondência com o famoso francês Pierre de Fermat, que tinha uma grande 
reputação como matemático. A troca de cartas subsequente não apenas levou a 
uma solução completa para o problema dos pontos mas também lançou a base 
para a solução de muitos outros problemas relacionados aos jogos de azar. Esta 
célebre correspondência, tida como muitos como a data de nascimento da teo- 
ria da probabilidade, foi importante por ter estimulado entre os matemáticos 
da Europa o interesse pela probabilidade. Isto porque Pascal e Fermat já eram 
reconhecidos como dois dos grandes matemáticos daquela época. Por exemplo, 
pouco tempo depois da troca de correspondência entre ambos, o jovem mate- 
mático holandês Christiaan Huygens foi a Paris discutir tais problemas e solu- 
ções, e o interesse e a atividade neste novo campo cresceu rapidamente. 


Exemplo 4) O problema dos pontos 


Realizam-se tentativas independentes que têm probabilidade de sucesso p e 
probabilidade de fracasso 1 — p. Qual é a probabilidade de que n sucessos ocor- 
ram antes de m fracassos? Se pensarmos que A e B estão jogando um jogo tal 
que A ganha 1 ponto no caso de um sucesso e B ganha 1 ponto no caso de um 
fracasso, então a probabilidade desejada é a probabilidade de que A seja o ven- 
cedor caso o jogo tenha que ser recomeçado de uma posição onde A precisasse 
de n pontos para vencer e B precisasse de m pontos para vencer. 


Solução Vamos apresentar duas soluções. A primeira solução foi obtida por 
Pascal e a segunda por Fermat. 
Vamos chamar de P, , a probabilidade de que n sucessos ocorram antes de 
m fracassos. Condicionando no resultado da primeira tentativa, obtemos 
Lia Dr + (1 -p)P, 


nyn-—l 


n=zl,;m=1 


(Por quê? Pense a respeito.) Usando as óbvias condições de contorno P,, 
= 0, Pom — 1, podemos resolver essas equações para P, ,. Contudo, em vez 
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seguir todos os detalhes tediosos dessa solução, vamos considerar a solução 
de Fermat. 

Fermat ponderou que, para que n sucessos ocorram antes de m fracassos, é 
necessário e suficiente que existam pelo menos n sucessos nas primeiras m + n 
— 1 tentativas (mesmo se o jogo tivesse que terminar antes que um total de m + 
n — 1 tentativas tivesse sido completado, poderíamos ainda assim imaginar que 
as tentativas adicionais necessárias pudessem ser realizadas). Isso é verdade, 
pois se ocorrem pelo menos n sucessos nas primeiras m + n — 1 tentativas, po- 
deria haver no máximo m — 1 fracassos naquelas mesmas m + n— 1 tentativas; 
assim, n sucessos ocorreriam antes de m fracassos. Se, no entanto, ocorressem 
menos que n sucessos nas primeiras m + n— 1 tentativas, deveriam ocorrer pelo 
menos m fracassos no mesmo número de tentativas; logo, n sucessos não ocor- 
reriam antes de m fracassos. 

Com isso, já que a probabilidade de exatos k sucessos nas m + n — 1 ten- 
tativas é igual a fi o a )rra — py"tr-1-k conforme mostrado no 
Exemplo 4f, tem-se que a probabilidade desejada de que ocorram n sucessos 
antes de m fracassos é 


m+n-—1 ade À 
Pam= > ( k )ra nes pyrtr-l-k n 


Nossos próximos dois exemplos lidam com problemas de jogos, onde o pri- 
meiro possui uma análise surpreendentemente elegante.* 


Exemplo 4k 


Suponha que existam inicialmente » jogadores, com o jogador i possuindo n, 
unidades, n, > 0,i = 1,...,r. Em cada rodada, dois dos jogadores são escolhidos 
para jogar uma partida, com o vencedor recebendo 1 unidade do perdedor. 
Qualquer jogador cuja fortuna cair para O é eliminado; isso continua até que 
apenas um único jogador possua todas asn = >: 4 n; unidades, sendo esse jo- 
gador declarado o vencedor. Supondo que os resultados das partidas sucessivas 
sejam independentes e que cada partida tenha a mesma probabilidade de ser 
vencida por qualquer um de seus dois jogadores, determine P, a probabilidade 
de que o i-ésimo jogador seja o vencedor. 


Solução Para começar, suponha que há n jogadores, cada um deles possuindo 
inicialmente 1 unidade. Considere a jogadora i. Em cada rodada que ela jogar, 
ela terá a mesma probabilidade de vencer ou perder uma unidade, sendo os 
resultados de cada rodada independentes. Além disso, ela continuará a jogar 
até que sua fortuna se torne ou 0, ou n. Como o mesmo ocorrerá com todos 
os demais n jogadores, tem-se que cada jogador tem a mesma chance de ser o 
grande vencedor, o que implica que cada um deles tem probabilidade 1/n de ser 
o grande vencedor. Agora, suponha que n jogadores sejam divididos em r times, 


* O restante desta seção deve ser considerado opcional. 
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com o time i contendo n, jogadores, i = 1,..., r. Então, a probabilidade de que o 
grande vencedor faça parte do time i é n/n. Mas como 


(a) o time i tem inicialmente uma fortuna total de n; unidades, i = 1,...,r,e 

(b) cada partida jogada por componentes de times diferentes tem a mesma pro- 
babilidade de ser vencida por qualquer um dos jogadores e resulta no in- 
cremento de 1 unidade na fortuna dos componentes do time vencedor e no 
decremento de 1 unidade na fortuna dos componentes do time perdedor, 


é fácil ver que a probabilidade de que o grande vencedor seja do time i é exa- 
tamente a probabilidade que desejamos. Assim, P, = n/n. Interessantemente, 
nosso argumento mostra que esse resultado não depende da maneira pela qual 
os jogadores de cada estágio são escolhidos. E 


No problema da ruína do jogador, há apenas 2 jogadores, mas não se supõe que 
eles sejam igualmente habilidosos. 


Exemplo 41 O problema da ruína do jogador 


Dois jogadores, 4 e B, apostam nos resultados de sucessivas jogadas de moe- 
das. Em cada jogada, se a moeda der cara, A ganha 1 unidade de B;se a moeda 
der coroa, 4 paga 1 unidade para B. Eles continuam a fazer isso até um deles 
ficar sem dinheiro. Se cada uma das jogadas de moeda é tida como um evento 
independente e cada jogada tem probabilidade p de dar cara, qual é a probabi- 
lidade de que A termine com todo o dinheiro se ele começar com i unidades e 
B começar com N — i unidades? 


Solução Suponha que E represente o evento em que A termina com todo o 
dinheiro, considerando que ele e B comecem com i unidades e N — i unidades, 
respectivamente. Além disso, para deixar clara a dependência da fortuna inicial 
de A, suponha que P, = P(E). Vamos obter uma expressão para P(E) condi- 
cionada ao lançamento da primeira moeda da forma como se segue: seja H o 
evento em que a primeira moeda dá cara; então 


P; = P(E) = PEIH)P(H) + PEIH9P(H) 
=pP(EIH) + (1 — pJP(EIHO 


Agora, dado que a primeira moeda dá cara, a situação após a primeira aposta 
é que À tem i + 1 unidades e B tem N — (i + 1). Como se supõe que as joga- 
das sucessivas são independentes com uma probabilidade comum p de dar 
cara, tem-se que, deste ponto em diante, a probabilidade de 4 ganhar todo . 
o dinheiro é exatamente igual âquela que teria caso o jogo começasse agora 
com À tendo uma fortuna inicial de i + 1 e B tendo uma fortuna de N — (i + 
1). Portanto, 


P(EIH) = Ps 
e, de forma similar, 


P(EIH") ad 
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Com isso, fazendo com que q = 1 —- p, obtemos 
P;=pPiua + gP1 i=1,2,...,N —1 (4.2) 


Usando as óbvias condições de contorno P, = 0 e P, = 1, vamos agora resolver 
a Equação (4.2). Como p + q = 1, essas equações são equivalentes a 


pP+gP,;=pPataP 
ou 


Pe PB =P ed FED NEM (4.3) 


Com isso, como ?, = 0, obtemos, da Equação (4.3), 


Propis SP, me É 
Pp Pp 


2 
Bope lp je (2) P, 
bp Pp 


(4.4) 


pa 
P; — Pri= LP — Pry)= (2) P, 
4 Pp 


á ada 
Px — Px =(Pya — Pyo)= (2) P, 
p Pp 


A soma das primeiras i — 1 equações de (4.4) resulta em 


nom (O + (8) ++ (8)7] 


ou 
Jus i 
Lo tai) se! z1 
p=) 1 — (a/p) 4 
q 
iP4 se-=1 
p 


Usando o fato de que P, = 1, obtemos 


1 — (g/D) 1 
-— >> + sep*s 
pel PRO 
1 se 


N 
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Com isso, 
1— (g/p) 1 
eps 
Pela” FF? (4.5) 
” sep=3 


Suponha que Q, represente a probabilidade de que B termine com todo o 
dinheiro quando A começa com i e B começa com N - i. Então, por simetria 
com a situação descrita, e trocando p por q e i por Ni, tem-se que 


1— (p/gN 
1= qi “9 ta 
OQ; 
N-i RA E 
N Faz 


Além disso, como q = 1/2 é equivalente a p = 1/2, temos, quando q = 1/2, 
1- (gp) 1- p/oN 


"+ CT *T- aN 
20º — pato) q — qNpioNr 
pN = qN qN e pN 
: PN — pN-igi = qn + gipN-i 
ci pN = qN 


Esse resultado também é verdadeiro quando p = q = 1/2, então 
P+Q0,=1 


Colocando em palavras, essa equação diz que, com probabilidade 1, ou A 
ou B terminará com todo o dinheiro; em outras palavras, a probabilidade de 
que o jogo continue indefinidamente com a fortuna de A estando sempre entre 
1eN-1ézero (o leitor deve ter cuidado porque, a priori, existem três resulta- 
dos possíveis nesse jogo de apostas, não dois: ou 4 vence, ou B vence, ou o jogo 
continua para sempre sem que ninguém vença. Acabamos de mostrar que esse 
último evento tem probabilidade 0). 

Como uma ilustração numérica desse resultado, se A começar com 5 unida- 
des e B com 10, então a probabilidade de A vencer seria de 1/3 caso p fosse 1/2, 
enquanto ela saltaria para 


se p fosse 0,6. 

Um caso especial do problema da ruína do jogador, que também é conhecido 
como o problema da duração do jogo, foi proposto a Huygens por Fermat em 1657 
A versão que Huygens propôs, que ele mesmo resolveu, considerava que 4 e B 
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tinham 12 moedas cada. Eles disputavam essas moedas em um jogo de 3 dados da 
seguinte maneira: sempre que saísse um 11 (independentemente de quem jogasse 
os dados), A daria uma moeda a B. Sempre que saísse um 14, B daria uma moeda 
a 4. Como P(dar 11) = 27/216 e P(dar 14) = 15/216, vemos do Exemplo 4h que, 
para 4, este é tão somente o problema da ruína do jogador com p = 15/42, comi 
= 12e N = 24.A forma geral do problema da ruína do jogador foi resolvida pelo 
matemático James Bernoulli e publicada 8 anos após a sua morte em 1713. 

Para uma aplicação do problema da ruína do jogador no teste de medica- 
mentos, suponha que duas drogas tenham sido desenvolvidas para tratar de- 
terminada doença. A droga i tem uma taxa de cura P, i = 1,2, no sentido de 
que cada paciente tratado com essa droga será curado com probabilidade P. 
Essas taxas de cura, no entanto, não são conhecidas, e estamos interessados em 
determinar um método para decidir se P, > P, ou P, > P.. Para decidir entre 
uma dessas duas alternativas, considere o teste a seguir: pares de pacientes serão 
tratados sequencialmente, com uma das pessoas recebendo a droga 1 e a outra 
a droga 2. Os resultados são determinados para cada um dos pares, e o teste 
para quando o número cumulativo de curas obtidas com o emprego de uma das 
drogas exceder o número de curas obtidas com o emprego da outra droga de 
acordo com um número fixo, predeterminado. Mais formalmente, suponha que 


E 1 seo paciente no j-ésimo par que receber a droga 1 for curado 
) O caso contrário 


= 1 seo paciente no j-ésimo par que receber a droga 2 for curado 
1º | 0 caso contrário 
Para um inteiro M positivo predeterminado, o teste é interrompido após a 
realização dos testes no par N, onde N é o primeiro valor de n tal que 


MAAX AY +.+Y)=M 
ou 
XAAX AV +.+Y)=-M 


No primeiro caso, verificamos que P, > P, e, no segundo caso, que P, > P,. 

De forma a verificar se o teste acima é bom ou não, gostaríamos de conhecer 
a probabilidade de ele levar a uma decisão incorreta. Isto é, para dados P, e P,, 
onde P, > P,, qual é a probabilidade de que o teste indique incorretamente que 
P,> P,? Para determinar essa probabilidade, note que, após verificarmos cada 
um dos pares, a diferença cumulativa de curas usando a droga 1 versus a droga 2 
crescerá 1 unidade com probabilidade P,(1 — P,) - pois esta é a probabilidade de 
que a droga 1 leve à cura e que 2 não — ou decrescerá 1 unidade com probabili- 
dade (1 —- P))P,,ou permanecerá a mesma com probabilidade P,P, + (1-PJ( 
— P,). Com isso, se considerarmos apenas os pares nos quais a diferença cumula- 
tiva se alterar, então a diferença aumentará 1 unidade com probabilidade 


P = P(aumentar 1/aumentar 1 ou diminuir 1) 
E Pa — Po) 
Edo PARA = PjPa 
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e diminuirá 1 unidade com probabilidade 
Pd = Pa) 
Pd = Po = PP 


1-P= 


Assim, a probabilidade de o teste confirmar que P, > P, é igual à probabi- 
lidade de que um apostador que vença cada uma das apostas de 1 unidade com 
probabilidade P vá cair M antes de subir M. Mas a Equação (4.5), comi = M,N 
= 2M, mostra que essa probabilidade é dada por 


Píteste confirmar que P; > P4) 


1- PM 
il P ) 
j RPE eae Sd Sa 


onde 
Pc Md =>) 


FO =P" PB =P) 


Por exemplo, se P, = 0,6 e P, = 0,4, então a probabilidade de uma decisão in- 
correta é de 0,017 quando M = 5. Essa probabilidade cai para 0,0003 quando 
M = 10. Z 


Suponha que nos seja dado um conjunto de elementos e queiramos deter- 
minar se pelo menos um dos componentes do conjunto possui certa proprie- 
dade. Podemos atacar essa questão em termos probabilísticos escolhendo um 
elemento do conjunto de forma tal que cada elemento tenha uma probabilida- 
de positiva de ser selecionado. Então a questão original pode ser respondida 
considerando-se a probabilidade de que o elemento aleatoriamente selecionado 
não possua a propriedade de interesse. Se essa probabilidade é igual a 1, então 
nenhum dos elementos do conjunto tem a propriedade desejada; se for menor 
do que 1, então pelo menos um elemento do conjunto tem essa propriedade. 

O exemplo final desta seção ilustra essa técnica. 


Exemplo 4m 
Um grafo completo de n vértices é definido como um conjunto de n pontos 
(chamados vértices) localizados em um plano e : linhas (chamadas de bor- 


das) conectando cada par de vértices. O grafo completo de 3 vértices é mos- 
trado na Figura 3.3. Suponha agora que cada borda de um grafo completo de 
n vértices deva ser colorida de vermelho ou azul. Para um inteiro fixo k, uma 
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Figura 3.3 


questão de interesse é: existe uma maneira de colorir as bordas de forma que 
: + k 
nenhum conjunto de k vértices tenha todas as suas 2 bordas da mesma cor? 


Pode-se mostrar com um argumento probabilístico que, se n não é muito gran- 
de, então a resposta é sim. 

O argumento é o seguinte: suponha que a probabilidade de cada borda ser 
colorida de vermelho ou azul seja igual, e que cada evento seja independente. 
Em outras palavras, cada borda é vermelha com probabilidade 1/2. Numere os 


n : sr . n ; 
k | conjuntos de k vértices e defina os eventos Ei,i = 1,..., ie ) da seguin- 


te maneira: 
E, = (todas as bordas do i-ésimo conjunto de k vértices são da mesma cor) 


Agora, como cada uma das( : )pordas de conexão de um conjunto de k vérti- 


ces tem a mesma probabilidade de ser vermelho ou azul, tem-se que a probabi- 
lidade de que todas elas tenham a mesma cor é 


(N Hk1/2 
PE) =2 (5) 


Portanto, como 


P[JE| => PE) (desigualdade de Boole) 
i i 


t 
cujas bordas de conexão sejam similarmente coloridas, satisfaz 


A 1 k(k—1)/2—1 
E is ( é) (5) 
í 


p 1 k(k—1)/2—1 
n k(k—-1)/2-1 
E) <2 


vemos que P (u e) a probabilidade de que exista um conjunto de k vértices 


Com isso, se 


ou, equivalentemente, se 
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então a probabilidade de que pelo menos um dos ( E ) conjuntos de k vértices 


tenha todos as bordas de conexão de mesma cor é menor que 1. Consequen- 
temente, levando em consideração a condição anterior em n e k, tem-se que 
existe uma probabilidade positiva de que nenhum conjunto de n vértices tenha 
todas as suas bordas de conexão da mesma cor. Mas essa conclusão implica que 
existe pelo menos uma maneira de colorir as bordas na qual nenhum conjunto 
de k vértices tem todas as suas bordas de conexão da mesma cor. Em 


Observações: (a) Enquanto o argumento anterior estabelece uma condi- 
ção em n e k que garante a existência de um esquema de cores que satisfaça a 
propriedade desejada, ele não fornece qualquer informação a respeito de como 
obter tal esquema (embora uma possibilidade fosse simplesmente escolher as 
cores aleatoriamente, verificar se o esquema de cores obtido satisfaz ou não a 
propriedade desejada e repetir o procedimento até que o faça). 

(b) O método de introduzir a probabilidade em um problema cujo enuncia- 
do é puramente determinístico é chamado de método probabilístico*. Outros 
exemplos desse método são dados no Exercício Teórico 24 deste capítulo e nos 
Exemplos 2t e 2u do Capítulo 7 


3.5 P(:|F) É UMA PROBABILIDADE 


Probabilidades condicionais satisfazem todas as propriedades das probabilida- 
des comuns, o que é demonstrado pela Proposição 5.1, que mostra que P(EIF) 
satisfaz os três axiomas de uma probabilidade. 


Proposição 5.1 


(a) 0=P(EIM=1 
(o) P(SIP=1 


(c) Se E,i = 1,2,...,são eventos mutuamente exclusivos, então 
[9,9] 06) 
P(UJEir|=5> PE 
1 1 


Demonstração Para demonstrar a letra (a), devemos mostrar que O = P(EF)/ 
P(F) < 1. O lado esquerdo da desigualdade é óbvio, enquanto o lado direito 
resulta de EF C F,o que implica P(EF) = P(F).A letra (b) é verdade porque 


PSP) PP 


SOS E RO) 


* Veja N. Alon, J. Spencer, and P. Erdos, The Probabilistic Method (New York: John Wiley 
& Sons, Inc., 1992). 
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A letra (c) resulta de 


P(P) 
SS PER 
1 


Il 


onde se obtém a penúltima igualdade porque E,E, = Gimplica EFE F = 6. O 


Se definirmos Q(E) = P(EI|F), então, da Proposição 5.1, O(E) pode ser vis- 
ta como uma função probabilidade dos eventos de S. Portanto, todas as pro- 
posições previamente provadas para as probabilidades se aplicam a Q(E). Por 


exemplo, temos 
QE, U E,) = O(E,) + O(E,) -Q(EE,) 
ou, equivalentemente, 


P(E,U EF) = P(EF) + P(EF) - P(E,EF) 


Também, se definirmos a probabilidade condicional O(E |E;) como Q(E,|E,) = 


O(E E)/O(E,), então, da Equação (3.1), temos 
Q(E1) = Q(E| EDV O(E) + Q(EIEDOCES) 


Como 
O(EE2) 
E,|E5) = ———— 
O(Es|E2) OE) 
a P(E, Es|F) 
P(ko|F) 
P(E,EoF) 
PF) 
= PE 
P(F) 
= P(E,|EsF) 


A Equação (5.1) é equivalente a 
PBP) = PEIES PUSIP) + PEIES PCESIP) 


(5.1) 
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Exemplo 5a 

Considere o Exemplo 3a, que trata de uma companhia de seguros que acredita 
que as pessoas podem ser divididas em duas classes distintas: aquelas que são 
propensas a sofrer acidentes e aquelas que não o são. Durante um ano, uma 
pessoa propensa a acidentes terá uma probabilidade de 0,4 de sofrer um aci- 
dente, enquanto o valor correspondente a uma pessoa não propensa a aciden- 
tes é de 0,2. Qual é a probabilidade condicional de que um novo segurado sofra 
um acidente em seu segundo ano de contrato, dado que ele ou ela tenha sofrido 
um acidente no primeiro ano? 


Solução Seja À o evento em que o segurado é propenso a sofrer acidentes, e 
A,i = 1,2,0 evento em que ele ou ela tenha sofrido um acidente no i-ésimo 
ano. Então, a probabilidade desejada, P(A,IA,), pode ser obtida colocando-se 
uma condição na propensão ou não de o segurado sofrer acidentes, da forma a 
. seguir 


P(A2|A) = P(AZ|AAs)P(AIAI) + P(ADIA As) PAS|As) 


Agora, 
P(AA)  P(AIAJP(A) 


P(AIAD) = = 
A pao) P(AD) 


Entretanto, assume-se que P(A) seja igual a 3/10, e foi mostrado no Exemplo 
3a que P(A,) = 0,26. Com isso, 
"0903 6 
FARO nao 
Assim, 


7 
P(AIA1) =1 — P(AIAs) = 13 


Como P(A,|AA,) = 0,4 e P(A,|A“A)) = 0,2, tem-se que 


6 7 
E: — > — 
P(AzlAs) = (0,4) B + (0,2) 75 = 0,29 E 


Exemplo 5b 


Um chimpanzé fêmea deu à luz. Não se tem certeza, contudo, de qual dos dois 
chimpanzés machos é o pai. Antes da realização de qualquer análise genética, 
tinha-se a impressão de que a probabilidade de o macho número 1 ser o pai era 
p; da mesma forma, imaginava-se que a probabilidade de o macho número 2 
ser o pai era 1 —- p. O DNA recolhido da mãe, do macho número 1 e do macho - 
número 2 indicou que, em uma localização específica do genoma, a mãe tem o 
par de genes (A, 4), o macho número 1 tem o par de genes (a, a), e o macho 
número 2 tem o par de genes (A, a). Se o teste de DNA mostra que o chim- 
panzé filhote tem o par de genes (A, a), qual é a probabilidade de que o macho 
número 1 seja o pai? 
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Solução Suponha que todas as probabilidades sejam condicionadas no evento 
em que a mãe tem o par de genes (A, 4), o macho número 1 tem o par de genes 
(a,a),e o macho número 2 tem o par de genes (A, a). Agora, seja M,o evento em 
que o macho número i, i = 1,2,é o pai, e B,, O evento em que o chimpanzé filho- 
te tem o par genético (A, a). Então, P(M,|B, .) é obtido da maneira a seguir: 
P(MiBaa) 

P(Baa) 
” P(BaalMyDP(M1) 

P(BsalM)PMy) + P(BaalMo)P(Mo) 


P(Mi|Baa) = 


e l-p 
1p+ (DA -p) 
Ss 
“-1+p 
Como + > p quando p < 1,a informação de que o par de genes do bebê é 


(A,a) aumenta a probabilidade de o macho número 1 ser o pai. Esse resultado 
é intuitivo porque é mais provável que o bebê tenha um par de genes (4,a) se 
M, for verdade do que se M, for verdade (sendo as respectivas probabilidades 
condicionais iguais a 1 e 1/2). [a 


O próximo exemplo trata de um problema da teoria das séries. 


Exemplo 5c 


Realizam-se tentativas independentes, cada uma com probabilidade de sucesso 
p e probabilidade de fracasso q = 1 — p. Estamos interessados em computar 
a probabilidade de que uma série de n sucessos consecutivos ocorra antes de 
uma série de m fracassos consecutivos. 


Solução Seja E o evento em que uma série de n sucessos consecutivos ocorre 
antes de uma série de m fracassos consecutivos. Para obter P(E), começamos 
condicionando no resultado da primeira tentativa. Isto é, fazendo com que H re- 
presente o evento em que a primeira tentativa resulta em um sucesso, obtemos 


P(E) = pP(EIH) + qgP(E|HS (5.2) 


Agora, se a primeira tentativa tiver sido bem-sucedida, uma das maneiras pelas 
quais podemos obter uma série de n sucessos antes de uma série de m fracassos 
seria obter sucessos nas n —1 tentativas seguintes. Então, vamos condicionar na 
ocorrência ou não de tal série. Isto é, supondo que F seja o evento em que as 
tentativas 2 a n resultam em sucessos, obtemos 


P(EIH) = P(EIFH)P(AH) + P(EIF H)P(FI|H) (5.3) 


Por um lado, claramente P(E|FH) = 1; por outro lado, se o evento F'H ocor- 
rer, então a primeira tentativa resultaria em um sucesso, mas haveria algum 
fracasso durante as primeiras n — 1 tentativas. Entretanto, quando esse fracas- 
so ocorrer, ele vai fazer com que todos os sucessos anteriores sejam desconsi- 
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derados, e a situação seria como se começássemos de novo com um fracasso. 
Com isso, 


P(EIFH) = P(EIH”) 
Como a independência das tentativas implica a independência de Fe H,e como 
P(F) = p”", tem-se da Equação (5.3) que 
PE) =p" + d — pr bP(EIHO (5.4) 
Vamos agora obter uma expressão para P(E|H”) de maneira similar. Isto é, su- 


pomos que G represente o evento em que todas as tentativas 2 a m são fracas- 
sos. Então, 


P(EIHS) = P(E|GH9P(GIHS) + P(E|IGHSP(GI|HS (5.5) 
Agora, GH é o evento em que as primeiras tentativas resultam em fracassos, 
de forma que P(E|GH”) = 0. Também, se G'H” ocorrer, a primeira tentativa 
será um fracasso, mas ocorrerá pelo menos um sucesso nas m — 1 tentativas 


seguintes. Como este sucesso faz com que todos os fracassos anteriores sejam 
desconsiderados, vemos que 


P(EIGH9 = P(E|H) 
Assim, como P(E|G'H) = P(G) = 1- q”! obtemos, de (5.5), 
PEIH9 = — q" DP(EIH) (5.6) 
Resolvendo as Equações (5.4) e (5.6), temos 
pra 


PEIH) = pri + qr prigra 
e 
PE?) = — A abro 
== pri E qr = prolgm— 
Assim, 


P(E) = pP(EIH) + gP(EIHO 
p+aprda- qr) 
“plsgqrl-p lgm- 

pra — q”) 


“pls qrio pr Igm- (5.7) 


É interessante notar que, pela simetria do problema, a probabilidade de se ob- 
ter uma série de m sucessos antes de uma série de n sucessos seria dada pela 
Equação (5.7) com p e q trocados, e n e m também trocados. Com isso, essa 
probabilidade seria igual a 


Písérie de m fracassos antes de uma série de n sucessos) 
gra 2] p") 
Es qr SE pr Eee qgrApr-l 


(5.8) 
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Como a soma das Equações (5.7) e (5.8) é igual a 1, tem-se que, com proba- 
bilidade 1, ou uma série de n sucessos ou uma série de m fracassos acabará 
ocorrendo. 

Como um exemplo da Equação (5.7), notamos que, ao jogar uma moeda 
honesta, a probabilidade de que uma série de duas caras preceda uma série de 
3 coroas é igual a 7/10. Para duas caras consecutivas antes de 4 coroas consecu- 
tivas, a probabilidade aumenta para 5/6. O 


Em nosso próximo exemplo, voltamos ao problema do pareamento (Exem- 
plo Sm, Capítulo 2), e desta vez obtemos uma solução usando probabilidades 
condicionais. 


Exemplo 5d 

Em uma festa, n homens tiram os seus chapéus. Os chapéus são então mistu- 
rados e cada homem seleciona um chapéu aleatoriamente. Dizemos que um 
pareamento ocorre quando um homem seleciona o seu próprio chapéu. Qual é 
a probabilidade de que 


(a) não ocorram pareamentos? 
(b) ocorram exatos k pareamentos? 


Solução (a) Seja E o evento em que nenhum pareamento ocorre e, para dei- 
xar explícita a dependência em relação a n, escreva P, = P(E). 
Começamos condicionando no ato do homem pegar ou não o 
seu próprio chapéu — chame esses eventos de M e Mº, respectiva- 
mente. Então, 


Pa = P(E) = P(EIM)P(M) + P(EIMS9 PMS) 


Claramente, P(EIM) = 0, então 


al 
P, = P(EIM9- 


(5.9) 


Agora, P(EIM”) é a probabilidade de que não ocorram parea- 
mentos quando n — 1 homens selecionam de um conjunto de n 
— 1 chapéus que não contém o chapéu de um daqueles homens. 
Isso pode acontecer de qualquer uma de duas maneiras mu- 
tuamente exclusivas: ou não ocorrem pareamentos e o homem 
extra não seleciona o chapéu extra (sendo este o chapéu do ho- 
mem que escolheu primeiro), ou não ocorrem pareamentos e 
o homem extra seleciona o chapéu extra. A probabilidade do 
primeiro desses eventos é simplesmente P, ,,o que é visto ao 
considerar-se o chapéu extra como se “pertencesse” ao homem 
extra. Como o segundo evento tem probabilidade [1/(n — 1)] 
P,-» temos 


n 


1 
P(EIMS = Pp + RE Tr 
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Assim, da Equação (5.9) 
n 


n-—1 1 
EA nt A Pro 


ou, de forma equivalente, 


1 
Pa — n-1 = = UPn=1 — Pa-2) (5.10) 


Entretanto, como P, é a probabilidade de que não ocorram pa- 
reamentos quando n homens selecionam entre os seus próprios 
chapéus, temos 


1 
P=0 P=> 
Assim, da Equação (5.10), 
(P, — Pj) 1 a 1 
E AD A 
(Pan Po) od 1 1 1 
ai RR RT ou Ph=5"uta 
e, em geral, 
1 1 (—1)" 
Eno But a n! 


(b 


ça 


Para obter a probabilidade de exatamente k pareamentos, con- 
sideramos qualquer grupo fixo de k homens. A probabilidade de 
que eles, e apenas eles, selecionem os seus próprios chapéus é 
dada por 
1 1 1 p (n — k)! 
nn-=1 n- (k — 1) Re 


onde P, , é a probabilidade condicional de que os outros n — k 
homens, selecionando entre os seus próprios chapéus, não obte- 


. n o 
nham pareamentos. Como existem k escolhas possíveis para 


um conjunto de k homens, a probabilidade desejada de exata- 
mente k pareamentos é 


dio aeiho a ua DE 
Pak 2 q “a =) n 


kt k! 
Um importante conceito na teoria da probabilidade é o da independência 
condicional de eventos. Dizemos que os eventos E, e E, são condicionalmente 
independentes dado F se, dado que F ocorreu, a probabilidade condicional de E, 
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ocorrer não seja afetada pela informação de que E, tenha ocorrido ou não. Mais 
formalmente, E, e E, são ditos condicionalmente independentes dado F se 


P(EJE;F) = P(EF) (5.11) 


ou, equivalentemente, 


P(E, EF) = P(EF) PCEJP) (5.12) 


A noção de independência condicional pode ser facilmente estendida para 
mais de dois eventos, e isso é deixado como exercício. 

O leitor deve notar que o conceito de independência condicional foi im- 
plicitamente empregado no Exemplo 5a, onde se supôs que os eventos em 
que um segurado sofre um acidente em seu i-ésimo ano, i = 1, 2,..., fossem 
condicionalmente independentes dado que a pessoa fosse ou não fosse pro- 
pensa a sofrer acidentes. O exemplo a seguir, que é às vezes chamado de regra 
de sucessão de Laplace, ilustra um pouco melhor o conceito de independência 
condicional. 


Exemplo 5e Regra de sucessão de Laplace 


Há k + 1 moedas em uma caixa. Quando jogada, a i-ésima moeda dará cara 
com probabilidade i/k, i = 0,1,...,k. Uma moeda é aleatoriamente retirada da 
caixa e então jogada repetidamente. Se as primeiras n jogadas resultarem todas 
elas em caras, qual é a probabilidade condicional de que também dê cara na (n 
+ 1)-ésima jogada? 


Solução Seja C,o evento em que a i-ésima moeda, i = 0,1,...,k, é inicialmente 
selecionada, F, o evento em que as primeiras n jogadas dão cara, e H o evento 
em que a (n + 1)-ésima jogada dá cara. A probabilidade desejada, P(HIF,), é 
obtida como a seguir: 
k 
P(HIFo) = >, PHIFC)P(CilFh) 
i=0 


Agora, assim que a i-ésima moeda for selecionada, é razoável supor que os 
resultados serão condicionalmente independentes, cada um deles dando cara 
com probabilidade i/k. Com isso, 
i 
P(H|F, Ci) = P(HI|C;) = x 


Também, 


P(CiFa PCB ICD)PCC; (RP [1 /(k 1 
Picii) = (Gif E IPC) GAP + D) 
DS PRAICIPCC) SGA + DJ 


j=0 j=0 
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Assim, 


k 
DC Za 
P(HIF) = E—— 


> qr” 
j=0 


Mas se k é grande, podemos usar as seguintes aproximações integrais 


Portanto, para k grande, 
n+1 


PE) = 72 


Exemplo 5f Atualizando informações sequencialmente 


Suponha que existam n hipóteses mutuamente exclusivas e exaustivamen- 
te possíveis, com probabilidades iniciais (às vezes chamadas de prévias) 
P(Hi), >. +1 PH) = 1.Agora,se a informação de que o evento E ocorreu for 
recebida, então a probabilidade condicional de que H, seja a hipótese verdadei- 
ra (às vezes chamada de probabilidade atualizada ou posterior de H,) é 


P(EIH)PHi) 


PÉ = SPEHpPE) 


(5.13) 


Suponha agora que saibamos de início que E, ocorreu e depois que E, ocorreu. 
Então, dada apenas a primeira informação, a probabilidade condicional de que 
H,seja a hipótese verdadeira é 

PElHoPHo)  PEIHDPH) 


PBU= pe) SS PEHPPÇD 


enquanto que, dadas ambas as informações acima, a probabilidade condicional de 
que H, seja a hipótese verdadeira é P(H|E,E,), o que pode ser computado por 
PE EBDP(H; 
PULIELE» = (E EH) PH) 
5; PB EH)PUT) 

Alguém poderia pensar, no entanto, em quando seria possível calcular 
P(H|E,E,) usando o lado direito da Equação (5.13) com E = E, e P(H,) troca- 
do por P(HJE,),j = 1,...,n. Isto é, quando seria legítimo pensar em P(HIE),j 
> 1, como as probabilidades prévias e então usar (5.13) para calcular as proba- 
bilidades posteriores? 
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Solução A indagação anterior é legítima desde que, para cada j = 1,...,n,0s 
eventos E, e E, sejam condicionalmente independentes dado H.. Pois se este 
for o caso, então 


P(EjEolHp = P(BH)PEH), j=1,..0,n 


Portanto, 
P(Eo HD PCB Ho PH) 
P(HIE,Eo) = P(EiE») 
— PE H9P(EHO 
PE) 
— PCBoIHDP(HIEDP(ES) 
E P(E1E2) 
— PEHP(HIE:) 
0,2) 
onde O(1,2) = Pete, Como a equação anterior é válida para todo i, obtemos, 
realizando uma soma, 


á + P(Eo|H)P(HIE 
1=> PB) =>, ODE 
i=1 dio 


o que mostra que 


n 
O(1,2) = >. P(E2|H)PCHEs) 
i=1 
e leva ao resultado 
P(Eo|H)PCHi Es) 
Da P(Bo|H9PCHIES) 


P(H;|E, E) = 


Por exemplo, suponha que uma de duas moedas seja escolhida para ser joga- 
da. Seja H, for o evento em que a moeda i, i = 1,2, é escolhida, e suponha que 
quando a moeda i é jogada, ela tenha probabilidade p, i = 1,2, de dar cara. 
Então as equações anteriores mostram que, para atualizar sequencialmente a 
probabilidade de que a moeda 1 seja aquela sendo jogada, dados os resultados 
das jogadas anteriores, tudo o que precisa ser mantido após cada nova jogada é 
a probabilidade condicional de que a moeda 1 seja aquela sendo utilizada. Isto 
é, não é necessário registrar todos os resultados anteriores. E 


RESUMO 


Para os eventos E e F, a probabilidade condicional de E dado que F ocorreu é 
representada por P(E|F) e definida como 
P(EF) 


PED = So 


A identidade 
P(E, E, --- En) = P(EDPCE-ES) --- PCEnIES --- Enm1) 
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é conhecida como a regra da multiplicação da probabilidade. 
Uma identidade valiosa é 


P(E) = P(EID PCP) + PCEIF9PFS) 


que pode ser usada para computar P(E) “condicionando” na ocorrência ou 
não de F. 
P(H)/P(H) é chamada de chance do evento H. A identidade 


P(HIE) | PH) P(EIH) 
PHIE)  PH9P(EIHO 


mostra que, quando se obtém uma nova evidência E, o valor da chance de H se 
torna o seu antigo valor multiplicado pela relação entre a probabilidade condi- 
cional da nova evidência quando H é verdadeiro e a probabilidade condicional 
quando H não é verdadeiro. 
Suponha que F,i = 1,..., n, sejam eventos mutuamente exclusivos cuja 

união é todo o espaço amostral. A identidade 

P(EIF)P(E) 

n 
> PEIF9P(Fi) 


i=1 


P(FE) = 


é conhecida como fórmula de Bayes. Se os eventos F, i = 1,...,n, são hipóteses 
concorrentes, então a fórmula de Bayes mostra como calcular as probabilidades 
condicionais dessas hipóteses quando a evidência adicional E se torna disponível 

Se P(EF) = P(E)P(F), dizemos que os eventos E e F são independentes. 
Essa condição é equivalente a P(EIF) = P(E) e P(F|E) = P(F). Assim, os even- 
tos E e F são independentes se o conhecimento da ocorrência de um deles não 
afetar a probabilidade do outro. 

Os eventos E,,..., E, são ditos independentes se, para cada um de seus sub- 
conjuntos E;,,..., Ei, 


P(Ei Ei) = P(Ei) Ei) 


Para um evento fixo F, P(E|F) pode ser considerada uma função probabilidade 
dos eventos E do espaço amostral. 


PROBLEMAS 
3.1 Dois dados honestos são rolados. Qual é 3.3 Use a Equação (2.1) para calcular, em 
a probabilidade condicional de que pelo uma mão de bridge, a probabilidade con- 
menos um deles caia no 6 se os dados caí- dicional de que Leste tenha 3 espadas 
rem em números diferentes? dado que Norte e Sul tenham um total 
3.2 Se dois dados honestos são rolados, qual é combinado de 8 espadas. 
a probabilidade condicional de que o pri- 3.4 Qual é a probabilidade de que pelo me- 
meiro caia no 6 se a soma dos dados é i? nos um de um par de dados honestos caia 
Calcule essa probabilidade para todos os no 6, dado que a soma dos dados seja i, i 


valores de i entre 2 e 12. =2,3,..,122 


3.5 Uma urna contém 6 bolas brancas e 9 bo- 


las pretas. Se 4 bolas devem ser seleciona- 
das aleatoriamente sem devolução, qual 
é a probabilidade de que as 2 primeiras 
bolas selecionadas sejam brancas e as 2 
últimas sejam pretas? 


3.6 Considere uma urna contendo 12 bolas, 


das quais 8 são brancas. Uma amostra de 
4 bolas deve ser retirada com devolução 
(sem devolução). Qual é a probabilidade 
condicional (em cada um dos casos) de 
que a primeira e a terceira bolas sacadas 
sejam brancas dado que a amostra sacada 
contenha exatamente 3 bolas brancas? 


3.7 O rei vem de uma família de 2 crianças. 


Qual é a probabilidade de que a outra 
criança seja a sua irmã? 


3.8 Um casal tem duas crianças. Qual é a pro- 


babilidade de que ambas sejam meninas 
se a mais velha das duas crianças for uma 
menina? 


3.9 Considere 3 urnas. 4 urna A contém 2 bo- 


las brancas e 4 bolas vermelhas, a urna B 
contém 8 bolas brancas e 4 bolas verme- 
lhas, e a urna € contém 1 bola branca e 4 
bolas vermelhas. Se 1 bola é selecionada 
de cada urna, qual é a probabilidade de 
que a bola escolhida da urna A seja bran- 
ca dado que exatamente 2 bolas brancas 
tenham sido selecionadas? 


3.10 Três cartas são aleatoriamente seleciona- 


das sem devolução de um baralho comum 
de 52 cartas. Suponha que B seja o even- 
to em que ambas as cartas são ases, 4, O 
evento em que o ás de espadas é escolhi- 
do, e 4 o evento em que pelo menos um 
ás é escolhido. Determine 

(a) P(BIA) 

(b) PCBIA) 


3.12 Uma recém-formada planeja realizar as 


primeiras três provas em atuária no próxi- 
mo verão. Ela fará a primeira prova em de- 
zembro, depois a segunda prova em janeiro 
e, se ela passar em ambas, fará a terceira 
prova em fevereiro. Se ela for reprovada 
em alguma prova, então não poderá fazer 
nenhuma das outras. A probabilidade de 
ela passar na primeira prova é de 0,9. Se ela 
passar na primeira prova, então a probabi- 
lidade condicional de ela passar na segun- 
da prova é de 0,8. Finalmente, se ela passar 
tanto na primeira quanto na segunda pro- 
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va, então a probabilidade condicional de 

ela passar na terceira prova é de 0,7 

(a) Qual é a probabilidade de ela passar 
em todas as três provas? 

(b) Dado que ela não tenha passado em 
todas as três provas, qual é a proba- 
bilidade condicional de ela ter sido 
reprovada na segunda prova? 


3.13 Suponha que um baralho comum de 52 


cartas (que contém 4 ases) seja dividido 
aleatoriamente em 4 mãos de 13 cartas 
cada. Estamos interessados em determi- 
nar p, a probabilidade de que cada mão 
tenha um ás. Seja E, o evento em que a 
i-ésima mão tem exatamente 1 ás. Deter- 
mine p = P(E,E,E,E,) usando a regra da 
multiplicação. 


3.14 Uma urna contém inicialmente 5 bolas 


brancas e 7 bolas pretas. Cada vez que 

uma bola é selecionada, sua cor é anota- 

da e ela é recolocada na urna juntamente 

com 2 outras bolas da mesma cor. Calcule 

a probabilidade de que 

(a) as primeiras 2 bolas selecionadas se- 
jam pretas e as 2 bolas seguintes se- 
jam brancas; 

(b) das 4 primeiras bolas selecionadas, 
exatamente 2 sejam pretas. 


3.15 Uma gravidez ectópica é duas vezes mais 


provável em mulheres fumantes do que 
em mulheres não fumantes. Se 32% das 
mulheres na idade reprodutiva são fu- 
mantes, que percentual de mulheres com 
gravidez ectópica são fumantes? 


3.16 Noventa e oito por cento de todas as crian- 


ças sobrevivem ao parto. Entretanto, 15% 
de todos os nascimentos envolvem cesa- 
rianas (C), e quando uma cesariana é feita 
os bebês sobrevivem em 96% dos casos. Se 
uma gestante aleatoriamente selecionada 
não fez uma cesariana, qual é a probabili- 
dade de que seu bebê sobreviva? 


3.17 Em certa comunidade, 36% das famílias 


têm um cão e 22% das famílias que pos- 

suem um cão também possuem um gato. 

Além disso, 30% das famílias têm um 

gato. Qual é 

(a) a probabilidade de que uma família 
aleatoriamente selecionada tenha 
tanto um cão quanto um gato? 

(b) a probabilidade condicional de que 
uma família aleatoriamente selecio- 
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nada tenha um cão dado que ela tam- 
bém tenha um gato? 


3.18 Um total de 46% dos eleitores de uma 


certa cidade classifica a si mesmo como 

petista, enquanto 30% se classificam como 

tucanos e 24% se classificam como demo- 

cratas. Em uma eleição local recente, 35% 

dos petistas, 62% dos tucanos e 58% dos 

democratas votaram. Um eleitor é esco- 

lhido aleatoriamente. Dado que essa pes- 

soa tenha votado na eleição local, qual é a 

probabilidade de que ele ou ela seja 

(a) petista? 

(b) tucana? 

(c) democrata? 

(d) Que fração dos eleitores participou 
da eleição local? 


3.19 Um total de 48% das mulheres e 37% dos 


homens que fizeram um curso para largar 

o cigarro seguiu sem fumar por pelo me- 

nos um ano após o final do curso. Essas 

pessoas frequentaram uma festa de co- 

memoração no final do ano. Se 62% da 

turma original era de homens, 

(a) que percentual daqueles que foram à 
festa era de mulheres? 

(b) que percentual da turma original foi à 
festa? 


3.20 Cinquenta e dois por cento dos estu- 


dantes de certa faculdade são mulheres. 
Cinco por cento dos estudantes desta 
faculdade estão se formando em ciência 
da computação. Dois por cento dos estu- 
dantes são de mulheres se formado em 
ciência da computação. Se um estudante 
é selecionado aleatoriamente, determine 
a probabilidade condicional de que 
(a) ele seja mulher dado que ele está se 
formando em ciência da computação 
(b) ele esteja se formando em ciência da 
computação dado que ele é uma mu- 
lher. 


3.21 Um total de 500 casais que trabalham par- 


ticiparam de uma pesquisa sobre os seus 
salários anuais, tendo-se como resultado: 


Marido 


Menos que Mais que 
Esposa R$25.000 R$25.000 


Menos que R$25.000 212 198 
Mais que R$25.000 36 54 


Por exemplo, em 36 dos casais, a mulher 

ganhava mais que R$25.000 e o marido 

menos do que essa quantia. Se um dos ca- 

sais é escolhido aleatoriamente, qual é 

(a) a probabilidade de o marido ganhar 
menos que R$25.0009 

(b) a probabilidade condicional de a mu- 
lher ganhar mais que R$25.000 dado 
que o seu marido ganha mais do que 
essa quantia? 

(c) a probabilidade condicional de a mu- 
lher ganhar mais que R$25.000 dado 
que o marido ganha menos do que 
essa quantia? 


3.22 Um dado vermelho, um azul e um amare- 


lo (todos com seis lados) são rolados. Es- 
tamos interessados na probabilidade de 
que o número que sair no dado azul seja 
menor do que aquele que sair no dado 
amarelo, e que este seja menor do que 
aquele que sair no dado vermelho. Isto 
é, com B, Ye R representando, respecti- 
vamente, os números que aparecem nos 
dados azul, amarelo e vermelho, estamos 
interessadosem P(B < Y< R). 
(a) Qual é a probabilidade de que um mes- 
mo número não saia em dois dados? 
(b) Dado que um mesmo número não saia 
em dois dos dados, qual é a probabili- 
dade condicional de que B < Y < R? 
(c) Oqueé P(B<Y<R)? 


3.23 A urna I contém 2 bolas brancas e 4 bolas 


vermelhas, enquanto a urna II contém 1 
bola branca e 1 bola vermelha. Uma bola 
é aleatoriamente escolhida da urna I e 

colocada na urna II, e então uma bola é 

selecionada aleatoriamente da urna II. 

Qual é 

(a) a probabilidade de que a bola selecio- 
nada da urna II seja branca? 

(b) a probabilidade condicional de que a 
bola transferida seja branca dado que 
uma bola branca tenha sido selecio- 
nada da urna II? 


3.24 Cada uma de duas bolas é pintada de pre- 


to ou dourado e então colocada em uma 

urna. Suponha que cada bola seja colori- 

da de preto com probabilidade 1/2 e que 

esses eventos sejam independentes. 

(a) Suponha que você tenha a informa- 
ção de que a tinta dourada tenha sido 
utilizada (e que portanto pelo menos 


uma das bolas tenha sido pintada de 
dourado). Calcule a probabilidade 
condicional de que ambas as bolas te- 
nham sido pintadas de dourado. 

(b) Suponha agora que a urna tenha vira- 
do e que 1 bola tenha caído. Ela tem 
a cor dourada. Qual é a probabilidade 
de que ambas as bolas sejam doura- 
das neste caso? 


3.25 O seguinte método foi proposto para se 


estimar o número de pessoas com idade 
acima de 50 anos que moram em uma 
cidade com população conhecida de 
100.000: “À medida que você caminhar 
pela rua, mantenha uma contagem con- 
tínua do percentual de pessoas que você 
encontrar com idade acima de 50 anos. 
Faça isso por alguns dias; então multipli- 
que o percentual obtido por 100.000 para 
obter a estimativa desejada” Comente 
esse método. 

Dica: Seja p a proporção de pessoas na 
cidade que tem idade acima de 50 anos. 
Além disso, suponha que «, represente a 
proporção de tempo que uma pessoa com 
idade abaixo de 50 anos passa nas ruas, e 
que «, seja o valor correspondente para 
aqueles com idade acima de 50 anos. Que 
tipo de grandeza estima o método sugeri- 
do? Quando é que a estimativa é aproxi- 
madamente igual a p? 


3.26 Suponha que 5% dos homens e 0,25% 


das mulheres sejam daltônicos. Uma pes- 
soa daltônica é escolhida aleatoriamente. 
Qual é a probabilidade dessa pessoa ser 
um homem? Suponha que exista um mes- 
mo número de homens e mulheres. E se a 
população consistisse em duas vezes mais 
homens do que mulheres? 


3.27 Todos os trabalhadores de uma certa em- 


presa vão dirigindo para o trabalho e es- 
tacionam no pátio da empresa. A empre- 
sa está interessada em estimar o número 
médio de trabalhadores transportados 
em um carro. Qual dos métodos a seguir 
vai permitir que a empresa estime esse 
número? Explique a sua resposta. 

1. Escolha aleatoriamente n trabalhado- 
res, descubra quantos vieram em um 
mesmo carro e calcule a média dos n 
valores. 


3.28 


3.29 


3.30 


3.31 
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2. Escolha aleatoriamente n carros pa- 
rados no pátio, descubra quantas pes- 
soas vieram naqueles carros e calcule 
a média dos n valores. 

Suponha que um baralho comum de 52 
cartas seja embaralhado e que suas cartas 
sejam então viradas uma a uma até que o 
primeiro ás apareça. Dado que o primeiro 
ás é a vigésima carta a aparecer, qual é a 
probabilidade condicional de que a carta 
seguinte seja o 

(a) ás de espadas? 

(b) dois de paus? 

Há 15 bolas de tênis em uma caixa, das 
quais 9 nunca foram usadas anteriormen- 
te. Três das bolas são escolhidas aleatoria- 
mente, utilizadas em uma partida, e então 
devolvidas para a caixa. Mais tarde, outras 
três bolas são retiradas aleatoriamente da 
caixa. Determine a probabilidade de que 
nenhuma dessas bolas nunca tenha sido 
usada. 

Considere duas caixas, uma contendo 1 
bola de gude branca e 1 branca, e a ou- 
tra contendo 2 bolas de gude brancas e 1 
branca. Uma caixa é selecionada aleato- 
riamente e uma bola de gude é retirada 
de forma aleatória. Qual é a probabilida- 
de de que a bola de gude seja preta? Qual 
é a probabilidade de que a primeira caixa 
tenha sido selecionada dado que a bola 
de gude é branca? 

Dona Aquina acabou de fazer uma bióp- 
sia para verificar a existência de um tu- 
mor cancerígeno. Evitando estragar um 
evento de família no final de semana, ela 
não quer ouvir nenhuma má notícia nos 
próximos dias. Mas se ela disser ao mé- 
dico para telefonar-lhe somente se as no- 
tícias forem boas, então, se o médico não 
ligar, Dona Aquina pode concluir que as 
notícias não são boas. Assim, sendo uma 
estudante de probabilidade, Dona Aqui- 
na instrui o médico a jogar uma moeda, 
Se der cara, o doutor deverá telefonar-lhe 
se as novidades forem boas e não telefo- 
nar-lhe se elas forem más. Se a moeda der 
coroa, o médico não deverá telefonar-lhe. 
Dessa maneira, mesmo se o médico não 
telefonar-lhe, as notícias não serão neces- 
sariamente más. Seja « a probabilidade 
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de que o tumor seja cancerígeno e B a 

probabilidade condicional de que o tu- 

mor seja cancerígeno dado que o médico 

não faça o telefonema. 

(a) Qual probabilidade é maior, a ou B? 

(b) Determine 8 em termos de a e de- 
monstre a sua resposta da letra (a). 


3.32 Uma família tem j crianças com probabi- 


lidade p, onde p, = 0,1,p, = 0,25,p; = 
0,35,p, = 0,3. Uma criança desta família é 
escolhida aleatoriamente. Dado que ela é 
a primogênita, determine a probabilidade 
condicional de que a família tenha: 

(a) apenas 1 criança; 

(b) 4 crianças. 

Repita as letras (a) e (b) quando a crian- 
ça selecionada aleatoriamente for a ca- 
çula. 


3.33 Em dias chuvosos, Joe chega atrasado ao 


trabalho com probabilidade 0,3; em dias 

não chuvosos, ele chega atrasado com 

probabilidade 0,1. Com probabilidade 0,7, 

choverá amanhã. 

(a) Determine a probabilidade de Joe 
chegar cedo amanhã. 

(b) Dado que Joe tenha chegado cedo, 
qual é a probabilidade condicional de 
que tenha chovido? 


3.34 No Exemplo 3f, suponha que a nova evi- 


dência esteja sujeita a possíveis interpre- 
tações e de fato mostre que é apenas 90% 
provável que o criminoso possua a carac- 
terística em questão. Neste caso, qual se- 
ria a probabilidade de o suspeito ser cul- 
pado (supondo, como antes, que ele tenha 
a característica procurada)? 


3.35 Com probabilidade 0,6, o presente foi es- 


condido pela mãe; com probabilidade 0,4, 

foi escondido pelo pai. Quando a mãe es- 

conde o presente, ela o esconde, em 70% 

das vezes, no segundo andar, e em 30% 

das vezes no primeiro andar. É igualmen- 

te provável que o pai esconda o presente 

no primeiro ou no segundo andar. 

(a) Qual é a probabilidade de o presente 
estar no segundo andar? 

(b) Dado que ele está no primeiro andar, 
qual é a probabilidade de que ele te- 
nha sido escondido pelo pai? 


3.36 As lojas 4, Be €C tem 50,75 e 100 empre- 


gados, respectivamente, e 50, 60 e 70% de- 
les são mulheres, respectivamente. Pedidos 


de demissão ocorrem de forma igualmente 
provável entre todos os empregados, inde- 
pendentemente do sexo. Uma empregada 
pede demissão. Qual é a probabilidade de 
que ela trabalhe na loja €? 


3.37 (a) Um jogador tem uma moeda honesta 


e uma moeda com duas caras em seu 
bolso. Ele seleciona uma das moedas 
aleatoriamente; quando ele a joga, ela 
dá cara. Qual é a probabilidade de 
esta moeda ser a honesta? 

(b) Suponha que ele jogue a mesma 
moeda uma segunda vez e, novamen- 
te, dê cara. Agora, qual é a probabili- 
dade de esta moeda ser a honesta? 

(c) Suponha que ele jogue a mesma moeda 
uma terceira vez € que agora dê coroa. 
Agora, qual é a probabilidade de esta 
moeda ser a honesta? 


3.38 A urna À tem 5 bolas brancas e 7 bolas 


pretas. À urna 5 em 3 bolas brancas e 12 
bolas pretas. Jogamos uma moeda ho- 
nesta; se der cara, retiramos uma bola da 
urna A. Se der coroa, retiramos uma bola 
da urna B. Suponha que uma bola branca 
seja selecionada. Qual é a probabilidade 
de que tenha dado coroa na moeda? 


3.39 No Exemplo 3a, qual é a probabilidade 


de que alguém sofra um acidente no se- 
gundo ano dado que ele ou ela não tenha 
sofrido acidentes no primeiro ano? 


3.40 Considere uma amostra de 3 bolas retira- 


da da seguinte maneira: começamos com 
uma urna contendo 5 bolas brancas e 7 
bolas vermelhas. Em cada rodada, uma 
bola é retirada da urna e sua é cor anota- 
da. A bola é então devolvida para a urna, 
juntamente com uma bola adicional de 
mesma cor. Determine a probabilidade 
da amostra conter exatamente 

(a) O bolas brancas; 

(b) 1 bola branca; 

(c) 3 bolas brancas; 

(d) 2 bolas brancas. 


3.41 Um baralho de 52 cartas é embaralhado e 


então dividido em dois maços de 26 car- 
tas cada. Uma carta é retirada de um dos 
maços; ela é um ás. O ás é então coloca- 
do no segundo maço. Este maço é então 
embaralhado e uma carta é retirada dele. 
Calcule a probabilidade de que a carta 
retirada seja um ás. Dica: Condicione na 
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possibilidade da carta retirada ser aquela 
que foi trocada. 


3.42 “Três cozinheiros, A, B e C, assam um tipo 


especial de bolo e, com respectivas proba- 
bilidades 0,02, 0,03 e 0,05, esse bolo não 
cresce. No restaurante onde trabalham, A 
cozinha 50%, B cozinha 30% e € cozinha 
20% desses bolos. Que proporção de “fra- 
cassos” é causada por A? 


3.43 Há 3 moedas em uma caixa. Uma delas 


3.44 


3.45 


3.46 


tem duas caras, outra é honesta e a tercei- 
ra é uma moeda viciada que dá cara em 
75% das vezes. Quando uma das 3 moe- 
das é selecionada aleatoriamente e joga- 
da, ela dá cara. Qual é a probabilidade de 
ela ser a moeda com duas caras? 

Três prisioneiros são informados pelo vi- 
gia de que um deles foi escolhido aleato- 
riamente para ser executado e os outros 
dois serão libertados. O prisioneiro A 
pede ao vigia para que ele lhe conte re- 
servadamente qual de seus companheiros 
de prisão será libertado, dizendo que não 
haveria dano em divulgar esta informa- 
ção porque ele já sabe que pelo menos 
um dos dois será libertado. O vigia recu- 
sa-se a responder a essa questão, dizendo 
que se 4 soubesse qual de seus colegas 
prisioneiros seria libertado, então a pro- 
babilidade de que ele mesmo viesse a ser 
executado aumentaria de 1/3 para 1/2. O 
que você pensa do raciocínio do vigia? 
Suponha que tenhamos 10 moedas tais 
que, se a i-ésima moeda for jogada, a pro- 
babilidade de ela dar cara é iguala ;/10,i = 
1,2,..., 10. Quando uma das moedas é se- 
lecionada aleatoriamente e jogada, ela dá 
cara. Qual é a probabilidade condicional 
de que tenha sido a quinta moeda? 

Em um ano qualquer, um homem usará 
o seu seguro de carro com probabilida- 
de p, e uma mulher terá probabilidade 
P; de usar o seu seguro de carro, onde P; 
* Dm A fração de segurados homens é 
iguala «a,0 < a < 1, Um segurado é es- 
colhido aleatoriamente. Se 4, represen- 
tar o evento em que este segurado fará 
uso de seu seguro em um ano, mostre 
que 


PALA) > MAs) 


Dê uma explicação intuitiva do porquê 
da desigualdade anterior ser verdade. 


3.47 Uma urna contém 5 bolas brancas e 10 bo- 


las pretas. Um dado honesto é rolado e um 
certo número de bolas é retirado da urna 
aleatoriamente de acordo com o número 
que saiu no dado. Qual é a probabilidade 
de que todas as bolas selecionadas sejam 
brancas? Qual é a probabilidade condicio- 
nal de que tenha saído um 3 no dado se to- 
das as bolas selecionadas forem brancas? 


3.48 Cada um de dois criados-mudos com apa- 


rência idêntica tem duas gavetas. O cria- 
do-mudo 4 contém uma moeda de prata 
em cada gaveta, e o criado-mudo B con- 
tém uma moeda de prata em uma de suas 
gavetas e uma moeda de ouro na outra. 
Um criado-mudo é selecionado aleato- 
riamente, uma de suas gavetas é aberta e 
uma moeda de prata é encontrada. Qual é 
a probabilidade de que exista uma moeda 
de prata na outra gaveta? 


3.49 O câncer de próstata é o tipo de câncer 


mais comum entre os homens. Para veri- 
ficar se alguém tem câncer de próstata, 
os médicos realizam com frequência um 
teste que mede o nível de PSA produzi- 
do pela próstata. Embora altos níveis de 
PSA sejam indicativos de câncer, o teste é 
notoriamente pouco confiável. De fato, a 
probabilidade de que um homem que não 
tenha câncer apresente níveis elevados de 
PSA é de aproximadamente 0,135, valor 
que cresce para aproximadamente 0,268 
se o homem tiver câncer. Se, com base em 
outros fatores, um fisiologista tiver 70% 
de certeza de que um homem tem câncer 
de próstata, qual é a probabilidade condi- 
cional de que ele tenha câncer dado que 
(a) o teste tenha indicado um nível eleva- 
do de PSA? 
(b) o teste não tenha indicado um nível 
elevado de PSA? 

Repita os cálculos anteriores, dessa vez 
supondo que o fisiologista acredite ini- 
cialmente que existam 30% de chance de 
que o homem em questão tenha câncer 
de próstata. 


3.50 Suponha que uma companhia de segu- 


ros classifique as pessoas em uma de três 
classes: risco baixo, risco médio € risco ele- 


3.51 


3.52 
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vado. Os registros da companhia indicam 

que as probabilidades de que pessoas com 

riscos baixo, médio e elevado estejam en- 
volvidas em acidentes ao longo do período 

de um ano são de 0,05, 0,15 e 0,30. Se 20% 

da população são classificados como de 

risco baixo, 50% de risco médio e 30% de 
risco elevado, que proporção de pessoas 

sofre acidentes ao longo de um ano? Se o 

segurado A não sofreu acidentes em 1997, 

qual é a probabilidade de que ele ou ela 

seja uma pessoa de risco baixo ou médio? 

Uma trabalhadora pediu ao seu supervisor 

uma carta de recomendação para um novo 

emprego. Ela estima que existam 80% de 
chances de ela conseguir o emprego se ela 
receber uma boa recomendação, 40% de 
chances se ela receber uma recomendação 
moderadamente boa, e 10% de chances se 
ela receber uma recomendação fraca. Ela 
ainda estima que as probabilidades de ela 

receber recomendações boas, moderadas e 

fracas são de 0,7,0,2 e 0,1, respectivamente. 

(a) Quão certa ela está de receber a nova 
oferta de trabalho? 

(b) Dado que ela receba a oferta, na opi- 
nião dela qual terá sido a probabilidade 
de ela ter recebido uma boa recomen- 
dação? Uma recomendação modera- 
da? Uma recomendação fraca? 

(c) Dado que ela não receba a oferta, na 
opinião dela qual terá sido a proba- 
bilidade de ela ter recebido uma boa 
recomendação? Uma recomendação 
moderada? Uma recomendação fraca? 

Uma estudante de segundo grau aguarda 
ansiosamente o recebimento de uma carta 
dizendo se ela foi aceita ou não em deter- 
minada faculdade. Ela estima que as pro- 
babilidades condicionais de receber a car- 
ta de notificação em cada um dos dias da 
próxima semana, dado que ela tenha sido 
aceita ou rejeitada, sejam as seguintes: 


P(carta | P(carta | 
Dia aceita) rejeitada) 
Segunda-feira 0,15 0,05 
Terça-feira 0,20 0,10 
Quarta-feira 0,25 0,10 
Quinta-feira 0,15 0,15 


Sexta-feira 0,10 0,20 


Ela estima que sua probabilidade de ser 

aceita seja de 0,6. 

(a) Qual é a probabilidade de que ela re- 
ceba a carta na segunda? 

(b) Qual é a probabilidade de que ela re- 
ceba a carta na terça dado que ela não 
tenha recebido uma carta na segunda? 

(c) Se nenhuma carta chegar até a quar- 
ta-feira, qual é a probabilidade condi- 
cional de que ela tenha sido aceita? 

(d) Qual é a probabilidade condicional de 
que ela seja aceita se a carta chegar na 
quinta? 

(e) Qual é a probabilidade condicional de 
que ela seja aceita se nenhuma carta 
chegar naquela semana? 


3.53 Um sistema paralelo funciona sempre 


que pelo menos um de seus componentes 
funcione. Considere um sistema paralelo 
de n componentes, e suponha que cada 
componente trabalhe independentemen- 
te com probabilidade 1/2. Determine a 
probabilidade condicional de que o com- 
ponente 1 funcione dado que o sistema 
está funcionando. 


3.54 Se você tivesse que construir um modelo 


matemático para os eventos E e F descri- 

tos nas letras (a) até (e) a seguir, você os 

consideraria eventos independentes? Ex- 
plique o seu raciocínio. 

(a) E é o evento em que uma mulher de 
negócios tem olhos azuis, F é o evento 
em que sua secretária tem olhos azuis. 

(b) E é o evento em que um professor 
tem um carro, F é o evento em que 
seu nome está na lista telefônica. 

(c) E é o evento em que um homem tem 
menos de 1,80 m de altura, F é o even- 
to em que ele pesa mais de 90 kg. 

(d) E é o evento em que uma mulher vive 
nos EUA, F é o evento em que ela 
vive no hemisfério ocidental. 

(e) E é o evento em que choverá amanhã, 
Fé o evento em que choverá depois 
de amanhã. 


3.55 Em uma turma, há 4 calouros, 6 calou- 


ras e 6 veteranos homens. Quantas ve- 
teranas devem estar presentes se sexo e 
turma devem ser independentes quando 
um estudante é selecionado aleatoria- 
mente? 


3.56 Suponha que você colecione cupons e 


que existam cupons de m tipos diferen- 
tes. Suponha também que cada vez que 
um novo cupom é recolhido, ele seja do 
tipo i com probabilidade p, i = 1,...,m. 
Suponha que você tenha conseguido seu 
n-ésimo cupom. Qual é a probabilidade 
de que ele seja de um novo tipo? 

Dica: Condicione no tipo deste cupom. 


3.57 Um modelo simplificado para a variação do 


preço de uma ação supõe que em cada dia 

o preço da ação suba 1 unidade com proba- 

bilidade p ou caia 1 unidade com probabi- 

lidade 1 — p. Supõe-se que as variações nos 
diferentes dias sejam independentes. 

(a) Qual é a probabilidade de que após 
2 dias o preço da ação esteja em seu 
valor original? 

(b) Qual é a probabilidade de que após 
3 dias o preço da ação tenha subido 
uma 1 unidade? 

(c) Dado que após 3 dias o preço da ação 
tenha subido 1 unidade, qual é a pro- 
babilidade de que ele tenha subido no 
primeiro dia? 


3.58 Suponha que queiramos gerar o resul- 


tado da jogada de uma moeda honesta, 
mas que tudo o que tenhamos à nossa 
disposição seja uma moeda viciada que 
dá cara com alguma probabilidade des- 
conhecida p diferente de 1/2. Considere 
o seguinte procedimento para realizar 
nossa tarefa: 
1. Jogue a moeda. 
2. Jogue a moeda de novo. 
3. Se ambas as jogadas resultarem em 
duas caras ou duas coroas, volte para 
o passo 1. 
4. Deixe que o resultado da última joga- 
da seja o resultado do experimento. 
(a) Mostre que o resultado tem a mesma 
probabilidade de dar cara ou coroa. 
(b) Poderíamos usar um procedimento 
mais simples no qual continuamos a 
lançar a moeda até que as duas últi- 
mas jogadas sejam diferentes e então 
deixamos com que o resultado seja 
aquele obtido na última jogada? 


3.59 Realizam-se jogadas independentes de 


uma moeda que dá cara com probabilida- 
de p. Supondo que He T representem os 
eventos “cara” e “coroa” qual é a probabi- 
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lidade de que os primeiros quatro resulta- 

dos sejam 

(a) H,H,H,B? 

(b) T,B,H,H? 

(c) Qual é a probabilidade de que o pa- 
drão T,H, H, H ocorra antes do pa- 
drão H,H,H,H? 

Dica para a letra (c): Como pode o padrão 

H,H,H,H ocorrer primeiro? 


3.60 A cor dos olhos de uma pessoa é determi- 


nada por um único par de genes. Se eles 

forem ambos genes de olhos azuis, então 

a pessoa terá olhos azuis; se eles forem 

ambos genes de olhos castanhos, então a 

pessoa terá olhos castanhos; e se um deles 

for um gene de olhos castanhos e o outro 
de olhos azuis, então a pessoa terá olhos 

castanhos (por causa disso, dizemos que o 

gene de olhos castanhos é dominante em 

relação ao de olhos azuis). Uma criança 
recém-nascida recebe independentemen- 
te um gene de olhos de cada um de seus 
pais, e o gene que ele recebe tem a mesma 
probabilidade de ser de qualquer um dos 
tipos de gene daquele pai. Suponha que 

João e seus pais tenham olhos castanhos, 

mas que sua irmã tenha olhos azuis. 

(a) Qual é a probabilidade de que João 
possua um gene de olhos azuis? 

(b) Suponha que a esposa de João tenha 
olhos azuis. Qual é a probabilidade 
de que seu primeiro filho tenha olhos 
azuis? 

(c) Se seu primeiro filho tiver olhos cas- 
tanhos, qual é a probabilidade de 
que seu próximo filho também tenha 
olhos castanhos? 


3.61 Genes relacionados ao albinismo são 


chamados de 4 e a. Apenas aqueles que 
recebem o gene a de ambos os pais são al- 
binos. Pessoas com o par de genes (A, a) 
têm aparência normal e, como eles podem 
passar o traço para os seus descendentes, 
são chamados de portadores. Suponha que 
um casal normal tenha duas crianças, com 
uma delas sendo albina. Suponha que a 
criança não albina se case com uma pessoa 
que se sabe ser portadora. 
(a) Qual é a probabilidade de que seu 
primeiro descendente seja albino? 
(b) Qual é a probabilidade condicional 
de que seu segundo descendente seja 
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albino dado que seu primogênito não 
oseja? 


3.62 Bárbara e Diana vão praticar tiro ao alvo. 


Suponha que cada um dos tiros de Bár- 
bara acerte o pato de madeira utilizado 
como alvo com probabilidade p,, enquan- 
to cada tiro de Diana o acerte com pro- 
babilidade p,. Suponha que elas atirem 
simultaneamente no mesmo alvo. Se o 
pato de madeira é derrubado (indicando 
que foi acertado), qual é a probabilidade 
de que 
(a) ambos os tiros tenham acertado o 
pato? 
(b) o tiro de Bárbara tenha acertado o 
pato? 


3.63 A e B estão envolvidos em um duelo. As 


regras do duelo rezam que eles devem sa- 
car suas armas e atirar um no outro simul- 
taneamente. Se um ou ambos são atingi- 
dos, o duelo é encerrado; se ambos os tiros 


erram os alvos, então repete-se o processo. 


Suponha que os resultados dos tiros sejam 

independentes e que cada tiro de A atinja 

B com probabilidade p,, e que cada tiro de 

B atinja A com probabilidade p,. Qual é 

(a) a probabilidade de que A não seja 
atingido? 

(b) a probabilidade de que ambos os due- 
listas sejam atingidos? 

(c) a probabilidade de que o duelo termi- 
ne após a n-ésima rodada de tiros? 


(a) 


(b) 
1 4 
A 3 >—s 
2 5 


E 
' 3 4 ne 


(d) a probabilidade condicional de que o 
duelo termine após a n-ésima rodada 
de tiros dado que A não tenha sido 
atingido. 

(e) a probabilidade condicional de que o 
duelo termine após a n-ésima rodada 
de tiros dado que ambos os duelistas 
tenham sido atingidos? 


3.64 Uma questão de verdadeiro ou falso é co- 


locada para um time formado por um ma- 

rido e sua esposa em um jogo de pergun- 

tas e respostas. Tanto o homem quanto 

a mulher darão, de forma independente, 

a resposta correta com probabilidade p. 

Qual das estratégias seguintes é a melhor 

para o casal? 

(a) Escolher um deles e deixar que a pes- 
soa escolhida responda a questão. 

(b) Ambos pensarem na questão e darem 
a resposta comum se estiverem de 
acordo ou, se não estiverem de acor- 
do, jogar uma moeda para determinar 
que resposta devem dar. 


3.65 No problema anterior, se p = 0,6€ o casal 


usar a estratégia da letra (b), qual é a pro- 
babilidade condicional de que o casal dê 
a resposta correta dado que marido e sua 
esposa (a) estejam de acordo” (b) não es- 
tejam de acordo? 


3.66 A probabilidade de fechamento do i-ési- 


mo relé nos circuitos mostrados na Figura 
34é pi = 1,2,3,4,5. Se todos os relés 


———— 


A 


Figura 3.4 Circuitos para o Problema 3.66. 


funcionam independentemente, qual é a 
probabilidade de que uma corrente flua 
entre A e B nos respectivos circuitos? 
Dica para o circuito da letra (b): Condi- 
cione no fechamento ou não do relé 3. 


3.67 Um sistema de engenharia formado por 


n componentes é chamado de “ sistema 

k de nº (k = n) se ele funcionar se e so- 

mente se pelo menos k de n componentes 

estiverem funcionando. Suponha que to- 
dos os componentes funcionem de forma 
independente. 

(a) Se o i-ésimo componente funcionar 
com probabilidade P,,i = 1,2,3,4,cal- 
cule a probabilidade de que um siste- 
ma “2 de 4” funcione. 

(b) Repita a letra (a) para um sistema “3 
de 5” 

(c) Repita para um sistema “k de n” 
quando todos as probabilidades P, 
são iguais a p (isto é,P,1 = 1,2,...,n). 


3.68 No Problema 3.66a, determine a proba- 


bilidade condicional de que os relés 1 e 
2 estejam ambos fechados dado que uma 
corrente circule de 4 para B. 


3.69 Certo organismo possui um par de cada 


um de 5 genes diferentes (que designare- 
mos pelas 5 primeiras letras do alfabeto). 
Cada gene aparece de duas formas (que 
designaremos pelas letras maiúscula e mi- 
núscula). Supõe-se que a letra maiúscula 
represente o gene dominante; nesse caso, 
se um organismo possui o par de genes 
xX, então ele terá a aparência externa 
do gene X. Por exemplo, se X representa 
olhos castanhos e x representa olhos azuis, 
então um indivíduo com um par de genes 
XX ou xX terá olhos castanhos, enquanto 
um indivíduo com um par de genes xx terá 
olhos azuis. A aparência característica de 
um organismo é chamada de fenótipo, en- 
quanto sua constituição genética é chama- 
da de genótipo (assim, 2 organismos com 
respectivos genótipos «4, bB, cc, dD, ee e 
AA, BB, cc, DD, ee teriam genótipos di- 
ferentes mas o mesmo fenótipo). No cru- 
zamento entre dois organismos, cada um 
contribui, aleatoriamente, com um de seus 
pares de genes de cada tipo. Supõe-se que 
as 5 contribuições de um organismo (uma 
de cada um dos 5 tipos) sejam indepen- 
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dentes entre si e também das contribui- 
ções de seu companheiro. No cruzamento 
entre organismos com genótipos aA, bB, 
cC, dD, eE e aa, bB, cc, Dd, ee, qual é a 
probabilidade de que a prole tenha (1) fe- 
nótipo ou (ii) genótipo parecido com 

(a) o primeiro de seus genitores? 

(b) o segundo de seus genitores? 

(c) ambos os seus genitores? 

(d) nenhum de seus genitores? 


3.70 Há uma chance de 50-50 de que a rainha 


seja portadora do gene da hemofilia. Se 
ela é portadora, então cada um dos prín- 
cipes tem uma chance de 50-50 de ter 
hemofilia. Se a rainha tiver tido três prín- 
cipes sadios, qual é a probabilidade de 
ela ser portadora? Se houver um quarto 
príncipe, qual é a probabilidade de que 
ele venha a desenvolver a hemofilia? 


3.71 Na manhã de 30 de setembro de 1982, as 


campanhas dos três times de beisebol na 
divisão oeste da liga nacional dos EUA 
eram as seguintes: 


Time Vitórias Derrotas 
Atlanta Braves 87 72 
San Francisco Giants 86 73 
Los Angeles Dodgers 86 73 


Cada time tinha 3 jogos a fazer. Os três jo- 
gos dos Giants eram contra os Dodgers, e 
os 3 jogos restantes dos Braves eram con- 
tra o San Diego Padres. Suponha que os 
resultados dos jogos restantes sejam inde- 
pendentes e que cada jogo tenha a mesma 
probabilidade de ser vencido por qualquer 
uma das equipes. Qual é a probabilidade 
de cada time conquistar o título da liga? 
Se dois times empatarem em primeiro lu- 
gar, eles devem jogar uma partida final que 
pode, com igual probabilidade, ser vencida 
por qualquer um dos times. 


3.72 A câmara de vereadores de uma cidade 


possui 7 vereadores, 3 dos quais formam 
um comitê diretivo. Novas propostas legis- 
lativas vão primeiramente para o comitê 
diretivo e depois para o restante da câmara 
se pelo menos 2 de 3 membros do comitê 
as aprovarem. Uma vez na câmara, a lei 
requer voto majoritário para ser aprovada. 
Considere uma nova lei e suponha que cada 
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membro da câmara irá aprová-la, indepen- 
dentemente, com probabilidade p. Qual é a 
probabilidade de que o voto de certo mem- 
bro do comitê diretivo seja decisivo no sen- 
tido de que se o voto daquela pessoa for 
invertido então o destino final da nova lei 
será invertido? Qual seria a probabilidade 
correspondente para um vereador que não 
pertença ao comitê diretivo? 


3.73 Suponha que cada filho de um casal tenha 


a mesma probabilidade de ser menino ou 
menina, independentemente do sexo das 
demais crianças da família. Para um casal 
com 5 crianças, calcule as probabilidades 
dos seguintes eventos: 

(a) todas as crianças têm o mesmo sexo; 
(b) os 3 filhos mais velhos são meninos e 
as crianças restantes são meninas; 

(c) exatamente 3 são meninos; 

(d) as duas crianças mais velhas são meni- 
nas; 

(e) há pelo menos uma menina. 


3.74 A e B se alternam no lançamento de um 


par de dados, parando quando 4 obtém 
uma soma igual a 9 ou quando B obtém 
uma soma igual a 6. Supondo que A role o 
dado primeiro, determine a probabilidade 
de que a última jogada seja feita por 4. 


3.75 Em certa aldeia, é tradicional que o filho 


mais velho e sua esposa cuidem dos pais 
dele em sua velhice. Nos últimos anos, no 
entanto, as mulheres desta aldeia, não 
querendo assumir responsabilidades, têm 
preferido não se casar com os filhos mais 
velhos de uma família. 

(a) Se cada família da aldeia tem duas 
crianças, qual é a proporção de filhos 
mais velhos? 

(b) Se cada família da aldeia tem três 
crianças, qual é a proporção de filhos 
mais velhos? 

Suponha que cada criança tenha a mesma 

probabilidade de ser menino ou menina. 


3.76 Suponha que E e F sejam eventos mu- 


tuamente exclusivos de um experimento. 
Mostre que, se tentativas independentes 
desse experimento forem realizadas, en- 
tão E ocorrerá antes de F com probabili- 
dade P(EXIP(E) + P(P. 


3.77 Considere uma sequência interminável 


de eventos independentes, onde cada 
tentativa tem a mesma probabilidade de 


levar a qualquer um dos resultados 1,2 ou 

3. Dado que 3 é o último dos resultados a 

ocorrer, determine a probabilidade con- 

dicional de que 

(a) a primeira tentativa leve ao resultado 1; 

(b) as duas primeiras tentativas levem ao 
resultado 1. 


3.78 A e B jogam uma série de partidas. Cada 


partida é independentemente vencida 
por 4 com probabilidade p e por B com 
probabilidade 1 — p. Eles param quando 
o número total de vitórias de um jogador 
é duas vezes maior do que o número de 
vitórias do outro jogador. Aquele com o 
maior número de vitórias completas é de- 
clarado o vencedor da série. 
(a) Determine a probabilidade de que 
um total de 4 partidas seja jogado. 
(b) Determine a probabilidade de que 4 
vença a série. 


3.79 Em jogadas sucessivas de um par de dados 


honestos, qual é a probabilidade de que 
saiam 2 setes antes de 6 números pares? 


3.80 Em certa competição, os jogadores têm 


a mesma habilidade, e a probabilidade 
de que um entre dois participantes seja 
vitorioso é de 1/2. Em um grupo de 2” jo- 
gadores, os jogadores formam pares uns 
com os outros de forma aleatória. Os 2” 
vencedores formam novos pares aleato- 
riamente, e assim por diante, até que reste 
um único vencedor. Considere dois par- 
ticipantes específicos, 4 e B, e defina os 
eventos 4, i = n,e E como 


A; A participa de exatamente i disputas; 
E: Ae B nunca jogam um contra o outro 


(a) Determine P(A)),i=1,...,n 
(b) Determine P(E) 
(c) Seja P, = P(E). Mostre que 


1 RD PAS 
= t5=(5) Ena 


e use essa fórmula para verificar a res- 
posta que você obteve na letra (b). 

Dica: Determine P(E) colocando uma 
condição na ocorrência de cada um dos 
eventos A, i = 1,...,n. Ao simplificar a 
sua resposta, use a identidade algébrica 


n—1 


Suit ss nr 4 (n— Dx 


i=1 a e x? 
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Para uma outra abordagem de solu- 
ção para este problema, note que há 
um total de 2" — 1 partidas jogadas. 

(d) Explique por que 2” —1 partidas são 

jogadas. 
Numere essas partidas e suponha que 
B, represente o evento em que 4 e B 
jogam entre si a i-ésima partida, i = 
1,27. 

(e) Determine P(B)). 

(f) Use a letra (e) para determinar P(E). 

3.81 Uma investidora tem participação em 
uma ação cujo valor atual é igual a 25. 
Ela decidiu que deve vender sua ação se 
ela chegar a 10 ou 40. Se cada mudan- 
ça de preço de 1 unidade para cima ou 
para baixo ocorrer com probabilidades 
de 0,55 e 0,45, respectivamente, e se as 
variações sucessivas são independentes, 
qual é a probabilidade de que a investi- 
dora tenha lucro? 

3.82 4 e B lançam moedas. A começa e con- 
tinua a jogar a moeda até que dê coroa, 
instante no qual B passa a jogar a moeda 
até que também dê coroa. Em seguida, 
À assume novamente o jogo e assim por 
diante. Suponha que ?, seja a probabili- 
dade de dar cara com A jogando a moeda 
e P, seja a probabilidade de dar cara com 
B jogando a moeda. O vencedor da parti- 
da é o primeiro a obter 
(a) uma sequência de 2 caras; 

(b) um total de 2 caras; 

(c) uma sequência de 3 caras; 

(d) um total de 3 caras. 

Em cada caso, determine a probabili- 
dade de A vencer a partida. 

3.83 O dado A tem 4 faces vermelhas e 2 bran- 
cas, enquanto o dado B tem duas faces 
vermelhas e 4 brancas. Uma moeda ho- 
nesta é lançada uma vez. Se ela der cara, 
o jogo continua com o dado A; se ela der 
coroa, então o dado B deve ser usado. 

(a) Mostre que a probabilidade de cair 
uma face vermelha em cada jogada é 
de 1/2. 

(b) Se as primeiras duas jogadas resulta- 
rem em vermelho, qual é a probabili- 
dade de que dê vermelho na terceira 
jogada? 

(c) Se o vermelho aparecer nas duas 
primeiras jogadas, qual é a probabi- 


lidade de que o dado A esteja sendo 
utilizado? 

3.84 Uma urna contém 12 bolas, das quais 4 
são brancas. Três jogadores - 4,B e C— 
tiram bolas da urna sucessivamente: pri- 
meiro 4, depois B, depois €C, depois 4 de 
novo e assim por diante. O vencedor é o 
primeiro a tirar uma bola branca. Deter- 
mine a probabilidade de vitória de cada 
jogador se: 

(a) cada bola for recolocada na urna após 
ser retirada. 

(b) as bolas retiradas não forem recoloca- 
das na urna. 

3.85 Repita o Problema 3.84 quando cada um 
dos 3 jogadores selecionar bolas de sua 
própria urna. Isto é, suponha que existam 
3 urnas diferentes com 12 bolas, cada uma 
contendo 4 bolas brancas. 

3.86 Seja S = (1,2,...,n] e suponha que A e B 
tenham, independentemente, a mesma 
probabilidade de formar qualquer um dos 
2” subconjuntos (incluindo o conjunto va- 
zio e o próprio espaço amostral S) de S. 
Mostre que 


P(A C Bj= (5) 


Dica: Suponha que N(B) represente o nú- 
mero de elementos em B. Use 


n 
P(ACB)=5> PIACBIN(B) = iJPIN(B) =) 
i=0 
Mostre que P(AB = (5) = (3º 

3.87 No Exemplo 5e, qual é a probabilidade 
condicional de que a i-ésima moeda seja 
selecionada dado que as n primeiras ten- 
tativas tenham dado cara? 

3.88 Na regra de sucessão de Laplace (Exem- 
plo 5e), os resultados das jogadas suces- 
sivas de moedas são independentes? Ex- 
plique. 

3.89 Um réu julgado por três juízes é declara- 
do culpado se pelo menos 2 dos juízes o 
condenarem. Suponha que, se o réu for 
de fato culpado, cada juiz terá probabili- 
dade de 0,7 de condená-lo, de forma in- 
dependente. Por outro lado, se o réu for 
de fato inocente, essa probabilidade cai 
para 0,2. Se 70% dos réus são culpados, 
calcule a probabilidade condicional de 
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o juiz número 3 condenar um réu dado 

que: 

(a) os juízes 1 e 2 0 tenham condenado; 

(b) um dos juízes 1 e 2 o tenha considera- 
do culpado e o outro o tenha conside- 
rado inocente; 

(c) os juízes 1 e 2 o tenham considerado 
inocente. 
Suponha que E, i = 1,2,3 represente 
o evento em que o juiz i considera o 


réu culpado. Esses eventos são inde- 
pendentes ou condicionalmente inde- 
pendentes? Explique. 


3.90 Suponha que n tentativas independentes 


sejam realizadas, com cada uma delas le- 
vando a qualquer um dos resultados 0, 1 
ou 2 com respectivas probabilidades p,, P, 
e p2, Re pi = 1. Determine a probabili- 
dade de que os resultados 1 e 2 ocorram 
pelo menos uma vez. 


EXERCÍCIOS TEÓRICOS 


3.1 Mostre que se P(A) > 0, então 


P(ABIA) > P(AB|A U B) 


3.2 Seja À C B. Expresse as seguintes proba- 


bilidades da forma mais simples possível: 


P(AIB), P(AIB9, PCBIA), PCBIAS) 


3.3 Considere uma comunidade escolar de m 


famílias, com n, delas possuindo i crianças, 
i=1,...,k, ai = m. Considere os dois 
métodos a Sad para selecionar uma 
criança: 

1. Escolha uma das m famílias aleato- 
riamente e então selecione aleatoria- 
mente uma emança daquela família. 

2. Escolha uma das > in; crianças alea- 
toriamente. si 

Mostre que o método 1 tem probabilida- 
de maior do que o método 2 de resultar 
na escolha de um filho primogênito. 
Dica: Ao resolver o problema, você preci- 
sará mostrar que 


Para fazer isso, multiplique as somas e 
mostre que, para todos os pares i, j, 0 co- 
eficiente do termo nn, é maior na expres- 
são à esquerda do que aquele à direita. 


3.4 Uma bola pode estar em qualquer uma 


de n caixas e tem probabilidade P, de 
estar na i-ésima caixa. Se a bola estiver 
na caixa i, uma busca naquela caixa tem 
probabilidade a, de encontrá-la. Mostre 


que a probabilidade condicional de que 
a bola esteja na caixa j, dado que a busca 
pela bola na caixa i não tenha sido bem 
sucedida, é 


P; Sica 
—L se 
=D, A 
A — a)P; sad 
1-— a;P; 1 


3.5 Diz-se que o evento F carrega informa- 


ções negativas a respeito do evento E, e 
escrevemos FN E,se 


P(EIP) = P(E) 


Demonstre ou dê contraexemplos para as 
seguintes afirmativas: 

(a) Se FN E, então EN F. 

(b) SeFNEeENG,então FNG. 

(c) SeFNEeGNE,então FONE. 
Repita as letras (a), (b) e (c) se N for 
trocado por 7. Dizemos que F carrega 
informação positiva a respeito de E, e 
escrevemos F 2 E, quando P(EIF) = 
P(E). 


3.6 Demonstre que, se E,, E,,..., E, são even- 


tos independentes, então 


PE UE U-UE)=1-T|Il- PE 


i=1 


3.7 (a) Uma urna contém n bolas brancas e 


m bolas pretas. As bolas são retira- 
das uma de cada vez até que somente 
aquelas de mesma cor sejam deixadas. 
Mostre que, com probabilidade n/(n 
+ m), todas elas são brancas. 


Dica: Imagine que o experimento 
continue até que todas as bolas sejam 
removidas, e considere a última bola 
sacada. 

(b) Um lago contém 3 espécies distintas 
de peixes, que chamaremos de R, B e 
G. Há r peixes R, b peixes B e g pei- 
xes G. Suponha que os peixes sejam 
retirados do lago em uma seguência 
aleatória (isto é, em cada seleção tem- 
se a mesma probabilidade de retirar- 
se qualquer um dos peixes restantes). 
Qual é a probabilidade de que os pei- 
xes do tipo R correspondam à primei- 
ra espécie a ser extinta no lago? 
Dica: Escreva P|R] = P(RBG) + 
P(RGB) e calcule as probabilidades 
no lado direito da igualdade primeiro 
condicionando nas últimas espécies a 
serem removidas. 


3.8 Sejam 4, B e € eventos relacionados ao 


experimento “rolar um par de dados” 


(a) Se 
P(AIC) > P(BIC) e P(A|C) > P(BICS 


demonstre que P(A) > P(B) ou dê 
um contraexemplo definindo os even- 
tos 4,B e € para os quais tal relação 


não seja verdadeira. 
(b) Se 


P(AIC) > P(AIC? e P(BIC) > P(BIC) 


demonstre que P(AB|C) > P(AB|CS) 
ou dê um contraexemplo definindo os 
eventos 4, Be C para os quais tal re- 
lação não seja verdadeira. 

Dica: Suponha que € seja o evento em 
que a soma de um par de dados é igual a 
10, que A seja o evento em que o primei- 
ro dado cai no 6, e que B seja o evento 
em que o segundo dado cai no 6. 


3.9 Considere duas jogadas independentes 


de uma moeda honesta. Suponha que 4 
seja o evento em que a primeira jogada 
dá cara, B o evento em que a segunda 
jogada dá cara e € o evento em que am- 
bas as jogadas da moeda caem no mesmo 
lado. Mostre que os eventos 4,B e C são 
independentes por pares — isto é, 4 e B 
são independentes, 4 e € são indepen- 
dentes, e B e C são independentes — mas 
não totalmente independentes. 
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3.10 Considere um grupo de n indivíduos. Su- 


ponha que a data de aniversário de cada 
pessoa tenha a mesma probabilidade de 
cair em qualquer um dos 365 dias do ano 
e também que os aniversários sejam even- 
tos independentes. Suponha que A, ,i < j, 
represente o evento em que as pessoas i e 
j têm a mesma data de aniversário. Mos- 
tre que esses eventos são independentes 
por pares, mas não independentes. Isto é, 


mostre que A4,, e 4,, são independentes, 


n . Es = 
mas Os ( 2 ) eventos 4, i * j não são in- 


if 
dependentes. 


3.11 Em cada uma das n jogadas independen- 


tes de uma moeda, obtém-se cara com uma 
probabilidade p. Quão grande precisa ser n 
para que a probabilidade de se obter pelo 
menos uma cara seja de pelo menos 1/2? 


3.12 Mostre que se0 = a, =<1,i= 1,2... então 


[0.0] 


il [0.6] 
Slallo-agl+[a-a=1 
j=1 


i=1 i=1 


Dica: Suponha que um número infinito de 
moedas seja jogado, que a, seja a probabi- 
lidade de que a i-ésima moeda dê cara, e 
considere a ocorrência da primeira cara. 


3.13 A probabilidade de se obter cara em uma 


única jogada de moeda é igual a p. Suponha 
que 4 comece e continue a jogar a moeda 
até que dê coroa, instante a partir do qual 
passa a vez para B. Depois, B continua a 
jogar a moeda até que dê coroa, instante 
a partir do qual passa a vez para 4 e as- 
sim por diante. Seja P, , a probabilidade de 
que A acumule um total de n caras antes 
que B acumule m caras. Mostre que 


Ph TE PP im + (1 -pX1 = Pra) 


*3.14 Suponha que você esteja jogando contra 


um adversário infinitamente rico e que 
em cada rodada você ganhe ou perca 1 
unidade com respectivas probabilidades 
pe1-p.Mostre que a probabilidade de 
que você termine falido é 


lsep=12 
(g'p)' se p > 1/2 


onde g = 1 -peirepresenta a sua fortu- 
na inicial. 
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3.15 Tentativas independentes com probabili- 
dade de sucesso p são realizadas até que 
um total de » sucessos seja obtido. Mostre 
que a probabilidade de que exatamente n 
tentativas são necessárias é 


(12 Dra = mr 


Use esse resultado para resolver o pro- 
blema dos pontos (Exemplo 4;). 

Dica: Para que n tentativas sejam necessá- 
rias para a obtenção de r sucessos, quan- 
tos sucessos devem ocorrer nas primeiras 
n—1 tentativas? 

3.16 Tentativas independentes com probabili- 
dade de sucesso p e probabilidade de fra- 
casso 1 — p são chamadas de tentativas de 
Bernoulli. Seja P, a probabilidade de que 
n tentativas de Bernoulii resultem em um 
número par de sucessos (0 é considerado 
um número par). Mostre que 


P, =p(1-P,,) + (1-D)P,, 


e use essa fórmula para demonstrar (por 
indução) que 


nã 


1+ 0-2" 


P= 5 


3.17 Suponha que n tentativas independentes 
sejam realizadas, com a tentativa i sendo 
bem-sucedida com probabilidade 1/(2i + 
1). Seja P, a probabilidade de que o núme- 
ro total de sucessos seja um número ímpar. 
(a) Determine P, paran = 1,2,3,4,5. 

(b) Obtenha uma fórmula geral para P,. 

(c) Deduza uma fórmula para P, em ter- 
mos de P, ,. 

(d) Verifique que fórmula obtida na letra 
(b) satisfaz à fórmula recursiva na le- 
tra (c). Como a fórmula recursiva tem 
solução única, isso prova que você es- 
tava correto. 

3.18 Seja Q, a probabilidade de que nenhuma 
série de 3 caras consecutivas apareça em 
n jogadas de uma moeda honesta. Mostre 
que 


1 1 1 
On = 3 Qn-1 + qQn-2 + gOn-3 
O0=01=0,=1 


Determine Q,. 
Dica: Condicione na primeira coroa. 


3.19 Considere o problema da ruína do joga- 
dor, com a exceção de que A e B concor- 
dem a jogar no máximo n partidas. Seja 
P,; a probabilidade de que A termine 
com todo o dinheiro quando 4 começar 
com ie B começar com N — i. Deduza uma 
equação para P, em termos de P, 1, ;1€ 
Pa-1,i-1,e calcule P;3,N =5. 

3.20 Considere duas urnas, cada uma contendo 
bolas brancas e pretas. As probabilidades 
de se retirarem bolas brancas da primeira 
e da segunda urnas são, respectivamente, 
pep'.Bolas são retiradas sequencialmen- 
te das urnas e em seguida recolocadas de 
acordo com o seguinte esquema: com 
probabilidade a, retira-se inicialmente 
uma bola da primeira urna, e, com pro- 
babilidade 1 — a, retira-se uma bola da 
segunda urna. As escolhas subsequentes 
são então realizadas de acordo com a re- 
gra de que sempre que uma bola branca 
for sacada (e recolocada), a próxima bola 
é retirada da mesma urna, mas quando 
uma bola preta é sacada, a próxima bola é 
retirada da outra urna. Seja a, a probabi- 
lidade de que a n-ésima bola seja escolhi- 
da da primeira urna. Mostre que 


D)+1 


a p'n=1 


East 
n+1 ep ne 


e use essa fórmula para provar que 
1-7 1-p 
+ 


CRS pp 
et dep ps! 
Seja P, a probabilidade de que a n-ésima 
bola selecionada seja branca. Determine 
P,. Além disso, calcule lim, ,, «, e lim, ,. 
Ea 
3.21 O Problema da Eleição. Em uma eleição, 
o candidato 4 recebe n votos e o candida- 
to B recebe m votos, onde n > m. Assu- 
mindo que todas as (n + m)!/n!m! ordens 
de votos sejam igualmente prováveis, 
suponha que P, , represente a probabili- 
dade de que 4 sempre esteja à frente na 
contagem dos votos. 
(a) Calcule P,,,P;5, PP; Pan Pao Pis 
(b) Determine P,,, P,o- 
(c) Com base nos resultados que você ob- 
teve nas letras (a) e (b), faça conjectu- 
ras a respeito do valor de P, ,. 


nos 
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(d) Deduza uma fórmula recursiva para 
P,m em termos de P, ,, € P,m- con- 
dicionando em quem recebe o último 
voto. 
(e) Use a letra (d) para verificar sua con- 
jectura da letra (c) usando uma prova 
de indução em n + m. 

3.22 Como um modelo simplificado de previ- 
são do tempo, suponha que o tempo ama- 
nhã (seco ou úmido) será o mesmo de 
hoje com probabilidade p. Mostre que, se 
o tempo está seco em 1º de janeiro, então 
P,,a probabilidade de que ele esteja seco 
n dias depois, satisfaz 


Pr=Qp- DP + 0 -p) 
Pç=1 


nz 


Demonstre que 
1.1 r 
=- — -— >= 
P, 3 + 3 (2p 1) n 0 


3.23 Uma sacola contém a bolas brancas e b 
bolas pretas. Bolas são tiradas da sacola 
de acordo com o seguinte método: 

1, Uma bola é escolhida aleatoriamente 
e descartada. 

2. Escolhe-se em seguida uma segunda 

bola. Se sua cor é diferente da bola 
anterior, ela é recolocada na sacola e 
o processo é repetido a partir do iní- 
cio. Se sua cor é a mesma, ela é des- 
cartada e começamos do passo 2. 
Em outras palavras, bolas são amos- 
tradas e descartadas até que uma mu- 
dança de cor ocorra, momento no qual 
a última bola é devolvida para a urna 
e o processo começa de novo. Seja P,, 
a probabilidade de a última bola na 
sacola ser branca. Demonstre que 


1 

Pab= 5 

ab 2 
Dica: Use indução em k = a + b. 

*3.24 Disputa-se um torneio com n competi- 


n 
dores em que cada um dos 2 | pares de 


competidores joga entre si exatamente 
uma vez, com o resultado de cada partida 
sendo a vitória de um dos competidores e 
a derrota do outro. Para um inteiro fixo k, 
k < n, uma questão de interesse é saber 
se é possível que o resultado do torneio 


seja tal que, para cada conjunto de k joga- 
dores, exista um jogador que vença cada 
membro do conjunto. Mostre que se 


kn—k 
n 1 
(Ob-(D] =: 
então tal resultado é possível. 
Dica: Suponha que os resultados das par- 
tidas sejam independentes entre si e que 


cada partida tenha a mesma probabilida- 


de de ser vencida por cada um dos com- 


n 


petidores. Numere os k conjuntos de k 


competidores e faça com que B, represen- 
te o evento em que nenhum competidor 
derrota todos os k jogadores no i-ésimo 
conjunto. Então use a desigualdade de 


Boole para limitar P [[JB;). 
i 
3.25 Demonstre diretamente que 
P(EIF) = P(EIFG)P(GIP) + P(EIFG9P(GIF) 


3.26 Demonstre a equivalência das Equações 
(5.11) e (5.12). 

3.27 Estenda a definição da independência 
condicional a mais de 2 eventos. 

3.28 Demonstre ou dê um contraexemplo. Se 
E, e E, são eventos independentes, então 
eles são condicionalmente independentes 
dado F. É 

3.29 Naregra de sucessão de Laplace (Exemplo 
Se), mostre que se as primeiras n jogadas 
dão cara, então a probabilidade condicio- 
nal de que as próximas m jogadas também 
deem cara é iguala (n+ D(n+tm+ 1). 

3.30 Na regra de sucessão de Laplace (Exem- 
plo 5e), suponha que as n primeiras jo- 
gadas resultem em r caras e n — r coroas. 
Mostre que a probabilidade de que a (n + 
1)-ésima jogada dê cara é (r + D/(n + 2). 
Para fazer isso, você terá que demonstrar 
e usar a identidade 

bo sã nim! 
fra dA dE ES 


Dica: Para demonstrar a identidade, con- 
sidere C(n,m) = o (A — y)”dy. Inte- 
grando por partes, obtém-se 


C(n,m) = mea +1,m- 1) 
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Começando com €C(n,0) = 1/(n + 1), 
demonstre essa identidade por indução 
em m. 

3.31 Suponha que um amigo seu com mente não 
matemática, porém filosófica, afirme que a 
regra de sucessão de Laplace deve estar in- 
correta porque ela pode levar a conclusões 
ridículas. “Por exemplo” ele diz, “a regra 
diz que se um garoto tem 10 anos de ida- 


de, tendo ele vivido 10 anos, tem probabi- 
lidade de 11/12 de viver mais um ano. Por 
outro lado, se o garoto tem um avô com 80 
anos de idade, então, pela regra de Laplace, 
o avô tem probabilidade de 81/82 de viver 
um ano a mais. Entretanto, isso é ridículo. 
Claramente, o garoto tem mais chances 
de viver um ano a mais do que o seu avô” 
Como você responderia ao seu amigo? 


PROBLEMAS DE AUTOTESTE E EXERCÍCIOS 


3.1 Em um jogo de bridge, Oeste não tem ases. 
Qual é a probabilidade de que seu parcei- 
ro (a) não tenha ases? (b) tenha 2 ou mais 
ases? (c) Quais seriam as probabilidades 
se Oeste tivesse exatamente 1 ás? 

3.2 A probabilidade de que uma bateria de 
carro nova funcione por mais de 10.000 
km é de 0,8, de que ela funcione por mais 
de 20.000 km é de 0,4, e de que ela fun- 
cione por mais de 30.000 km é de 0,1. Se 
uma bateria de carro nova ainda está fun- 
cionando após 10.000 km, qual é a proba- 
bilidade de que 
(a) sua vida total exceda 20.000 km? 

(b) sua vida adicional exceda 20.000 km? 

3.3 Como podem 20 bolas, sendo 10 brancas e 
10 pretas, serem colocadas em duas urnas 
de forma a maximizar a probabilidade de 
que uma bola branca seja sorteada se uma 
das urnas for selecionada aleatoriamente e 
depois uma bola for sorteada dessa urna? 

3.4 A urna À contém duas bolas brancas e 
uma bola preta, enquanto a urna B con- 
tém uma bola branca e 5 bolas pretas. 
Uma bola é aleatoriamente retirada da 
urna A e colocada na urna B. Uma bola é 
então sorteada da urna B. Essa bola tem 
cor branca. Qual é a probabilidade de a 
bola transferida ser branca? 

3.5 Uma urna tem r bolas vermelhas e w 
bolas brancas que são sorteadas uma de 
cada vez. Seja r, O evento em que a i-ési- 
ma bola retirada é vermelha. Determine 
(a) P(R;) 

(b) P(RJRs) 
(c) P(RiIRS) 

3.6 Uma urna contém b bolas pretas e r bolas 

vermelhas. Uma das bolas é sorteada, mas 


quando ela é colocada de volta na urna, c 
bolas adicionais da mesma cor são coloca- 
das juntamente com ela. Agora, suponha 
que sorteemos outra bola. Mostre que a 
probabilidade de que a primeira bola te- 
nha cor preta, dado que a segunda bola 
sorteada seja vermelha, é b/(b + r + c). 


3.7 Um amigo escolhe 2 cartas aleatoriamen- 


te, sem repô-las, de um baralho comum de 

52 cartas. Em cada uma das situações se- 

guintes, determine a probabilidade condi- 

cional de que ambas as cartas sejam ases. 

(a) Você pergunta ao seu amigo se uma 
das cartas é o ás de espadas e seu ami- 
go responde afirmativamente. 

(b) Você pergunta ao seu amigo se a pri- 
meira carta selecionada é um ás e seu 
amigo responde afirmativamente. 

(c) Você pergunta ao seu amigo se a se- 
gunda carta selecionada é um ás e seu 
amigo responde afirmativamente. 

(d) Você pergunta ao seu amigo se uma 
das cartas selecionadas é um ás e seu 
amigo responde afirmativamente. 


3.8 Mostre que 


PHIE) PH) P(EIH) 
P(GIE)  P(G) P(EIG) 


Suponha que, antes que uma nova evi- 
dência seja observada, a hipótese H tenha 
probabilidade três vezes maior do que a 
hipótese G de ser verdade. Se a nova evi- 
dência é duas vezes mais provável quando 
G é verdade do que quando H é verdade, 
qual hipótese é mais provável após a ob- 
servação da nova evidência”? 


3.9 Você pede ao seu vizinho para ele regar 


uma planta enquanto você está de férias. 
Sem água, a planta morrerá com probabili- 


dade 0,8; com água, morrerá com probabili- 

dade 0,15. Você tem 90% de certeza de que 

seu vizinho se lembrará de regar a planta. 

(a) Qual é a probabilidade da planta es- 
tar viva quando você voltar? 

(b) Se a planta estiver morta quando você 
voltar, qual é a probabilidade de que 
seu vizinho tenha se esquecido de re- 
gá-la? 


3.10 Seis bolas são sorteadas de uma urna que 


contém 8 bolas vermelhas, 10 bolas ver- 

des e 12 bolas azuis. 

(a) Qual é a probabilidade de que pelo me- 
nos uma bola vermelha seja sorteada? 

(b) Dado que nenhuma bola vermelha 
tenha sido sorteada, qual é a proba- 
bilidade de que existam exatamente 2 
bolas verdes entre as 6 escolhidas? 


3.11 Uma pilha do tipo C está em condição de 


trabalho com probabilidade 0,7, enquanto 
uma pilha do tipo D está em condição de 
trabalho com probabilidade 0,4. Uma pi- 
lha é selecionada aleatoriamente de um 
cesto com 8 pilhas do tipo C e 6 do tipo D. 
(a) Qual é a probabilidade de a pilha fun- 
cionar? 
(b) Dado que a pilha não funcione, qual 
é a probabilidade condicional de que 
ela seja do tipo C? 


3.12 Maria levará dois livros consigo em uma 


viagem. Suponha que a probabilidade de 
ela gostar do livro 1 seja de 0,6, a probabi- 
lidade de ela gostar do livro 2 seja de 0,5, 
e a probabilidade de ela gostar de ambos 
os livros seja de 0,4. Determine a probabi- 
lidade condicional de ela gostar do livro 2 
dado que ela não tenha gostado do livro 1. 


3.13 Sorteiam-se bolas de uma urna que con- 


tém inicialmente 20 bolas vermelhas e 10 

bolas azuis. 

(a) Qual é a probabilidade de que todas 
as bolas vermelhas sejam retiradas 
antes de todas as azuis? 

Agora suponha que a urna contenha 
inicialmente 20 bolas vermelhas, 10 
bolas azuis e 8 bolas verdes. 

(b) Agora, qual é a probabilidade de que 
todas as bolas vermelhas sejam retira- 
das antes das bolas azuis? 

(c) Qual é a probabilidade de que as co- 
res se esgotem na ordem azul, verme- 
lho e verde? 
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(d) Qual é a probabilidade de que o gru- 
po de bolas azuis seja o primeiro dos 
três grupos a ser removido? 


3.14 Joga-se uma moeda que tem probabili- 


dade de 0,8 de dar cara. 4 observa o re- 

sultado — cara ou coroa — e se apressa a 

contá-lo para B. Entretanto, com proba- 

bilidade 0,4, A já terá esquecido o resulta- 

do quando ele se encontrar com B. Se A 

tiver esquecido o resultado, então, em vez 

de admitir isso para B, ele dirá, com pro- 
babilidade 0,5, que a moeda deu cara ou 

coroa. (Se ele se lembrar, então ele dirá a 

B o resultado correto.) 

(a) Qual é a probabilidade de que B re- 
ceba a informação de que a moeda 
tenha dado cara? 

(b) Qual é a probabilidade de que B receba 
como informação o resultado correto? 

(c) Dado que B tenha recebido a infor- 
mação de que a moeda deu cara, qual 
é a probabilidade de que ela de fato 
tenha dado cara? 


3.15 Em certas espécies de ratos, os de cor preta 


são dominantes em relação aos de cor mar- 

rom. Suponha que um rato preto com dois 

pais pretos tenha tido uma cria marrom. 

(a) Qual é a probabilidade de que este 
rato seja um rato preto puro (em vez 
de ser um rato híbrido com um gene 
preto e outro marrom)? 

(b) Suponha que, quando o rato preto 
cruzar com um rato marrom, todas as 
suas 5 crias sejam pretas. Agora, qual 
é a probabilidade de que o rato preto 
seja puro? 


3.16 (a) No Problema 3.66(b), determine a 


probabilidade de que uma corrente 
flua de A para B, condicionando no 
fechamento do relé 1. 

(b) Determine a probabilidade condicio- 
nal de que o relé 3 esteja fechado dado 
que uma corrente flua de 4 para B. 


3.17 Para o sistema k de n descrito no Proble- 


ma 3.67, suponha que cada componente 
funcione independentemente com proba- 
bilidade 1/2. Determine a probabilidade 
condicional de que o componente 1 esteja 
funcionando, dado que o sistema funcio- 
ne, quando 

(a) k=1,n=2; 

(DD) k=2,n=3. 
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3.18 O Sr. Jonas bolou um sistema de apostas 


para vencer na roleta. Quando ele joga, 
ele aposta no vermelho, mas ele faz essa 
aposta somente após as 10 rodadas an- 
teriores terem dado números pretos. Ele 
pensa que a sua chance de vencer é bas- 
tante elevada porque a probabilidade de 
ocorrerem 11 rodadas consecutivas dan- 
do preto é bastante pequena. O que você 
pensa desse sistema? 


3.19 Três jogadores jogam moedas ao mesmo 


tempo. A moeda jogada por A(BJ[C] dá 
cara com probabilidades P(P)[P.]. Se 
uma pessoa obtém um resultado diferente 
dos outros dois, então ele sai da disputa. Se 
ninguém sair, os jogadores jogam as moe- 
das de novo até que alguém saia. Qual é à 
probabilidade de que A saia do jogo? 


3.20 Suponha que existam n resultados possí- 


veis para uma tentativa, com o resultado 
i sendo obtido com probabilidade p, i = 
n 


1,..,n,)) pi = 1.Se duas tentativas inde- 


i=1 
pendentes forem observadas, qual é a pro- 
babilidade de que o resultado da segunda 
tentativa seja maior do que o da primeira? 


3.21 Se Ajogan + 1e Bjogan moedas hones- 


tas, mostre que a probabilidade de que A 
obtenha mais caras do que B é de 1/2. 

Dica: Condicione em qual jogador terá o 
maior número de caras após n moedas te- 
rem sido jogadas (há três possibilidades). 


3.22 Demonstre ou dê um contraexemplo para 


as três afirmativas a seguir: 

(a) Se E é independente de F,e E é in- 
dependente de G, então E é indepen- 
dente de FU G. 

(b) Se E é independente de F, E é inde- 
pendente de G,e FG = (, então E é 
independente de FU G. 

(c) Se E é independente de F, F é inde- 
pendente de G e E é independente de 
FG, então G é independente de EF, 


3.23 Suponha que 4 e B sejam eventos com 


probabilidades positivas. Diga se as afir- 

mativas a seguir são (1) necessariamente 

verdadeiras, (ii) necessariamente falsas 

ou (iii) possivelmente verdadeiras. 

(a) Se A e B são mutuamente exclusivos, 
então eles são independentes. 

(b) Se 4 e B são independentes, então 
eles são mutuamente exclusivos. 


3.24 


3.25 


3.26 


3.27 


3.28 


(c) P(A) = P(B) = 0,6,e A e B são mu- 
tuamente exclusivos. 

(d) P(A) = P(B) = 0,6,e A e B são inde- 
pendentes. 

Ordene as alternativas a seguir da mais 

provável à menos provável: 

1. Uma moeda honesta dá cara. 

2. Três tentativas independentes, cada 
uma das quais bem-sucedida com 
probabilidade 0,8, resultam em su- 
cessos. 

3. Sete tentativas independentes, cada 
uma das quais bem sucedida com pro- 
babilidade 0,9, resultam em sucessos. 

Duas fábricas locais, 4 e B, produzem 

rádios. Cada rádio produzido pela fá- 

brica 4 tem probabilidade de 0,05 de 
apresentar defeitos, enquanto cada rá- 
dio produzido pela fábrica B tem proba- 
bilidade de 0,01 de apresentar defeitos. 

Suponha que você compre dois rádios 

que tenham sido produzidos pela mes- 

ma fábrica, que tem a mesma probabi- 

lidade de ser a fábrica A ou a fábrica B. 

Se o primeiro rádio que você verificou 

está com defeito, qual é a probabilidade 

condicional de que o outro também es- 
teja com defeito? 

Mostre que, se P(A|B) = 1, então P(BIA9) 

=1. 

Uma urna contém inicialmente 1 bola 

vermelha e 1 bola azul. Em cada roda- 

da, uma bola é retirada aleatoriamente e 

substituída por duas outra bolas de mes- 

ma cor (por exemplo, se a bola vermelha 

é a primeira a ser escolhida, então haverá 

2 bolas vermelhas e 1 bola azul na urna 

quando ocorrer a próxima seleção). Mos- 

tre por indução matemática que a pro- 

babilidade de que existam exatamente i 

bolas vermelhas na urna após n rodadas é 

del(n+D,l=izsn+1 

Um total de 2n cartas, das quais 2 são ases, 

deve ser dividido entre 2 jogadores, com 

cada um dos jogadores recebendo n car- 
tas. Cada jogador deve então declarar, em 
sequência, se ele recebeu algum ás. Qual 

é a probabilidade condicional de que o 

segundo jogador não tenha ases, dado 

que o primeiro jogador declare afirmati- 

vamente que tenha algum ás, quando (a) 

n=22(b)n = 10? (c)n = 100? Para que 
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valor converge a probabilidade quando n 

tende a infinito? Por quê? 

3.29 Existem n tipos diferentes de cupons de 
desconto. Cada cupom obtido é, indepen- 
dentemente dos tipos já recolhidos, do 
tipo i com probabilidade 3“ ,p; = 1. 

(a) Se n cupons são recolhidos, qual é a 
probabilidade de que se consiga um 
de cada tipo? 

(b) Suponha agora que p, =p, =... =P, 
= 1/n. Seja E, o evento em que não 
há cupons de tipo i entre os n cupons 
selecionados. Aplique em P(U,E,) a 


identidade inclusão-exclusão para a 
probabilidade da união dos eventos 
para demonstrar a identidade 


n 
nt= Den(a)e: — of 
k=0 
3.30 Mostre que, para quaisquer eventos E e 
F, 
P(EJEU P) = P(EIF) 


Dica: Calcule P(E|E U F) condicionando 
na ocorrência de F. 


Capítulo 


Variáveis Aleatórias 


VARIÁVEI ALEATÓRIAS É k | 
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VARIÂNCIA É 


1 
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8 OUTRAS DISTRIBUIÇÕES DE: PROBABILIDADE DISCRETAS 
.9 VALOR ESPERADO DE SOMAS DE VARIÁVEIS ALEATÓRIAS 


4.1 VARIÁVEIS ALEATÓRIAS 


Frequentemente, quando realizamos um experimento, estamos interessados 
principalmente em alguma função do resultado e não no resultado em si. Por 
exemplo, ao jogarmos dados, estamos muitas vezes interessados na soma dos 
dois dados, e não em seus valores individuais. Isto é, podemos estar interes- 
sados em saber se a soma dos dados é igual 7, mas podemos não estar preocu- 
pados em saber se o resultado real foi (1, 6), (2,5), (3,4), (4,3),(5,2) ou (6,1). 
Também, ao jogarmos uma moeda, podemos estar interessados no número de 
caras que vão aparecer, e não na sequência de caras e coroas que teremos como 
resultado. Essas grandezas de interesse, ou, mais formalmente, essas funções 
reais definidas no espaço amostral, são conhecidas como variáveis aleatórias. 

Como o valor da variável aleatória é determinado pelo resultado do ex- 
perimento, podemos atribuir probabilidades aos possíveis valores da variável 
aleatória. 


Exemplo 1a 


Suponha que nosso experimento consista em jogar 3 moedas honestas, com H 
simbolizando cara e T simbolizando coroa. Se Y representar o número de caras 
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que aparecerem, então Y é uma variável aleatória que pode ter um dos valores 
0,1,2e 3 com respectivas probabilidades 


PY =0=P(TT,T)=- : 
PY=)=M(TIH,QOETD,(HTT)= : 
PY =9)=PCTH,H,(HTH,(HHNM)= : 
PW=3=P(H,H,H)) = : 


Como Y deve receber um dos valores de O a 3, devemos ter 
3 3 
= Plijt=d)=s Bir=o 
i=0 i=0 


o que, naturalmente, está de acordo com as probabilidades anteriores. n 


Exemplo 1b 


Três bolas são selecionadas aleatoriamente e sem devolução de uma urna con- 
tendo 20 bolas numeradas de 1 a 20. Se apostamos que pelo menos uma das 
bolas selecionadas tem um numero maior ou igual a 17, qual é a probabilidade 
de vencermos a aposta? 


Solução Seja X o maior número selecionado. Então X é uma variável aleatória 
que pode ter qualquer um dos valores 3, 4,..., 20. Além disso, se supomos que cada 


uma das 3 )seleções possíveis tem a mesma probabilidade de ocorrer, então 


(=) 
sis dels d (1.1) 


Obtém-se a Equação (1.1) porque o número de seleções que resultam no even- 
to [X = i) é tão somente o número de seleções que resultam na escolha da bola 


de número i e de duas das bolas de números 1 a i — 1. Como há claramente ( : ) 
E 2 : ) seleções como essa, obtemos as probabilidades expressas na Equação 


(1.1), da qual vemos que 


(2) 
7) 3 
PY === 2 = 0,150 


He 
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= =D = 0,134 
CAS ET = 5 
ã 
17 
P(X = 18 É 0,119 
dida 20 = 5 da 
3 
2).a 
g) 
P(X=17= x 0,105 


Portanto, como o evento [X = 17) é a união dos eventos disjuntos (X = i),i = 17, 
18, 19,20, a probabilidade de vencermos a aposta é 


P(X = 17) = 0,105 + 0,119 + 0,134 + 0,150 = 0,508 = 


Exemplo 1c 


Tentativas independentes que consistem em jogar uma moeda com proba- 
bilidade p de dar cara são realizadas continuamente até que dê cara ou que 
um total de n jogadas tenha sido realizado. Se X representa o numero de 
vezes que a moeda é jogada, H simboliza cara e T simboliza coroa, então X 
é uma variável aleatória que pode ter qualquer valor 1,2,3,...,n com respec- 
tivas probabilidades 


PX=lj=PiH|= 
PX=2)=PCTH)=G-—pp 


PX=3=P(TTI,HJ)=1-p)?p 


PX=n-)=PITLT,..sTLHD)J=U- pp 
n—2 


PX=0)=PIT,T,...TLDMDT.. LHS - pr 


n—-1 n—1 
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Como verificação, note que 


P [o = ) =" Pt =1) 
i=1 i=1 


=5'pd-pt+ a pr! 
1-(1- py 
2] ( p) | Es a o py 


1-1 —p) 


=1-d-prl+d-p 
=1 | 


Exemplo 1d 


Três bolas são sorteadas de uma urna contendo 3 bolas brancas, 3 bolas verme- 
lhas e 5 bolas pretas. Suponha que ganhemos R$ 1,00 por cada bola branca sor- 
teada e percamos R$ 1,00 para cada bola vermelha sorteada. Se R representa 
nosso total de vitórias no experimento, então X é uma variável aleatória que 
pode ter valores 0, +1, +2, +3 com respectivas probabilidades 


en OCO) 5 
0) 
EDER 


PX=2)=PWX = nb Md.s 
5) 


6) 
3 1 
3 = re 
) 11 165 
3 
Essas probabilidades são obtidas, por exemplo, notando-se que para que X 
seja igual a 0, ou todas as 3 bolas selecionadas devem ser pretas, ou 1 bola de 


Pl 


PX=3=PfX = 
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cada cor deve ser selecionada. Similarmente, o evento (X = 1) ocorre se 1 bola 
branca e 2 pretas forem selecionadas ou se 2 bolas brancas e 1 vermelha forem 
selecionadas. Como verificação, notamos que 


3 3 
55+39+154+1+394+1541 
SE Ppe=) + Spg=-p=D12I0t Ator. 


165 : 
i=0 i=1 
A probabilidade de ganharmos algum dinheiro é dada por 
3 
55 1 
> PX=b===5 
= 165 3 = 


Exemplo 1e 


Suponha que existam N tipos distintos de cupons de desconto e que, cada vez 
que alguém pegue um cupom, este tenha, independentemente das seleções an- 
teriores, a mesma probabilidade de ser de qualquer um dos N tipos. Uma variá- 
vel aleatória de interesse é T, o número de cupons que precisam ser recolhidos 
até que alguém obtenha um conjunto completo de pelo menos um de cada tipo. 
Em vez de deduzir P(T = n) diretamente, comecemos considerando a probabi- 
lidade de T ser maior que n. Para fazer isso, fixe n e defina os eventos 4,, 4,,..., 
Ay da seguinte maneira: A, é o evento em que nenhum cupom do tipo j está 
contido nos primeiros n cupons recolhidos, j = 1,..., N. Com isso, 


N 
PT >n=P| UA; 
j=1 


= P(A) — 55 PAGA) + 
j js 
+ DDD PAGA AD 
jisja<<jk 
+ (DNF PÇA? --- An) 
Agora, A, ocorrerá se cada um dos cupons recolhidos não for do tipo j. Como 


cada um dos cupons não será do tipo j com probabilidade (N — 1)/N, temos, pela 
independência assumida dos tipos de cupons sucessivos, 


N-1y” 
reap= (E) 


Também, o evento A, A, ocorre se nenhum dos n primeiros cupons recolhidos 
for do tipo j, ou j,. Assim, novamente usando independência, vemos que 


N- 24" 
PlApAm) = ( N ) 
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O mesmo raciocínio leva a 


NO" 
PlAj An Ago = ( N ) 


e vemos que, para n > 0, 
N-—1y” N N— 2" N N-—-3y” 
dO Gn GC 
N( N 1º 
ce (wo) (a) 


Etr o 


A probabilidade de T ser igual a n pode agora ser obtida da fórmuia anterior 
pelo uso de 


PT>n-)=PT=n)+P(T>n) 
ou, de forma equivalente, 
PT=n]j=PT>n-1)-PT>an) 


Outra variável aleatória de interesse é o número de cupons de tipos distintos 
contidos nas n primeiras seleções — chame essa variável aleatória de D,. Para cal- 
cular P[D, = kl, comecemos fixando a nossa atenção em um conjunto particular 
de k tipos distintos e determinemos a probabilidade de que esse conjunto consti- 
tua o conjunto de tipos distintos obtidos nas primeiras n seleções. Agora, para que 
esta seja a situação, é necessário e suficiente que, dos n primeiros cupons obtidos, 


A: cada um é um desse k tipos 
B: cada um desses k tipos é representado 


Agora, cada cupom selecionado será um dos k tipos com probabilidade k/N, en- 
tão a probabilidade de que A seja válido é (k/N)". Também, dado que um cupom 
é um dos k tipos em consideração, é fácil ver que ele tem a mesma probabilidade 
de ser de qualquer um desses k tipos. Com isso, a probabilidade condicional de 
B dado que A ocorra é igual à probabilidade de que um conjunto de n cupons, 
cada um com mesma probabilidade de ser de qualquer um dos k tipos possíveis, 
contenha um conjunto completo de todos os k tipos. Mas essa é tão somente a 
probabilidade de que o número necessário para se acumular um conjunto com- 
pleto, quando se escolhe entre os k tipos, é menor ou igual a n. Essa probabilida- 
de pode ser obtida a partir da Equação (1.2) com k no lugar de N. Assim, temos 


k n 
na (8 


k-1 NA 
P(BIA) =1 — DO) (º E ') (amas 


i=1 
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Finalmente, como há ( N 


k ) escolhas possíveis para o conjunto de k tipos, 


chegamos a 


PD,=k)= E ) P(AB) 


(OT EE or 


Observação: Como alguém deve juntar pelo menos N cupons para obter um 
conjunto completo, tem-se que P(T > n) = 1 sen < N. Portanto, da Equação (1.2), 
obtemos a interessante identidade combinatorial de que, para inteiros1 =n < N, 


N-1 Ee 
N N-i HA 
(NE crer 


i=1 


que pode ser escrita como 


N-1 an 
N N-i HI 
Ea) st 


i=0 


ou, multiplicando-se por (—1)"N” e fazendo-se | = N-i, 
N 


»(5 remo l=n<N 


j=1 
Para uma variável aleatória X, a função F definida por 
F(x) = PX < x) —00 << x <.00 


é chamada de função distribuição cumulativa, ou, mais simplesmente, de função 
distribuição de X. Assim, a função distribuição especifica, para todos os valores 
reais de x, a probabilidade da variável aleatória ser menor ou igual a x. 

Agora, suponha que a = b. Então, como o evento [X = a) está contido no 
evento [(X = b), tem-se que F(a), a probabilidade do primeiro, é menor ou igual 
do que F(b), a probabilidade do segundo. Em outras palavras, F(x) é uma fun- 
ção não decrescente de x. Outras propriedades especiais da função distribuição 
são dadas na Seção 4.10. 


4.2 VARIÁVEIS ALEATÓRIAS DISCRETAS 


Uma variável aleatória que pode assumir no máximo um número contável de 
valores possíveis é chamada de variável discreta. Para uma variável discreta X, 
definimos a função discreta de probabilidade (ou simplesmente função de pro- 
babilidade) p(a) de X como 


pla) = PlX = a) 
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A função discreta de probabilidade p(a) é positiva para no máximo um número 
contável de valores de a. Isto é, se X deve assumir um dos valores x,, x,,..., então 


p(x)=0  parai=1,2... 
p(xo)=0 para todos os demais valores de x 


Como X deve receber um dos valores x,, temos 
o 
>pw)=1 
i=1 


É frequentemente instrutivo apresentar a função de probabilidade em for- 
mato gráfico desenhando p(x;) no eixo y em função de x, no eixo x. Por exem- 
plo, se a função de probabilidade de X é 


i 1 1 
p(O) = 4 p(1) = 2 p(2) = A 


podemos representar essa função graficamente conforme mostrado na Figu- 
ra 4.1. Da mesma forma, um gráfico da função de probabilidade da variável 
aleatória que representa a soma dos resultados obtidos quando dois dados são 
rolados é ilustrado na Figura 4.2. 


Exemplo 2a 
A função de probabilidade de uma variável X é dada por p(i) = exfil,i= 0,1, 
2,..., onde À é algum valor positivo. Determine (a) P(X = 0) e (b) P(X > 2). 


oo 
Solução Como 5º p(i) = 1, temos 
i=0 


ou , . . 
o que, como e* = 53 x*/il implica 


i=0 
N E 
ce=1louc=e* 


p(x) 


Figura 4.1 
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10 


Figura 4.2 


Com isso, 


| ias 
(a) PX=0)=e2º/0!= em 


(bd) PX>2W=1-PXS9)=I-PX=0-PX=1) 
- PX=2) 


2 [nt] 


A função distribuição cumulativa F pode ser expressa em termos de p(a) 
como 


Fa= >, pG) 


todox = a 


Se X é uma variável aleatória discreta cujos valores possíveis são x,, X,, Xs,..., 
onde x, < x, < x; <... então a função distribuição F de X é uma função degrau. 
Isto é, o valor de F é constante em intervalos [x,.,,x,) e então dá um passo (ou 
salto) de tamanho p(x,) em x;. Por exemplo, se X tem uma função de probabi- 
lidade dada por 


1 1 1 1 
p(D) = 4 p= 2 PG) = 8 p(4) = 8 


então sua função distribuição cumulativa é 


[e 


a<1 
lI<a<2 
F(a) = 2<a<3 
3=<=a<4 
4=<a 


a go BIO pI 
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F(a) 

1 e 

5 em 

3 PRECE 

4 

Po —— 
I I L Ao a 
1 2 3 4 


Figura 4.3 


Essa função é descrita graficamente na Figura 4.3. 
Note que o tamanho do passo em cada um dos valores 1,2,3 e 4 é igual à 
probabilidade de que X assuma aquele valor particular. 


4.3 VALOR ESPERADO 


Um dos conceitos mais importantes na teoria da probabilidade é aquele do 
valor esperado de uma variável aleatória. Se X é uma variável aleatória com 
função de probabilidade p(x), então a esperança, ou o valor esperado, de X, 
representada por E[X], é definida por 


EX]= >, xp6) 


x:p(0)>0 


Colocando em palavras, o valor esperado de X é uma média ponderada dos 
possíveis valores que X pode receber, com cada valor sendo ponderado pela 
probabilidade de que X seja igual a esse valor. Por exemplo, se a função de 
probabilidade de X é dada por 


1 
p(O) = 3 = p(1) 


mug=o(1) +i(D)=d 


é tão somente a média ordinária dos dois valores possíveis, O e 1, que X pode 
assumir. Por outro lado, se 


então 


1 2 
p(O) = 3 PD = 3 


gui=o(1) +1(2)=2 


então 
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é uma média ponderada dos dois valores possíveis, O e 1, onde ao valor 1 se dá 
duas vezes mais peso do que ao valor 0, já que p(1) = 2p(0). 

Outra motivação da definição de esperança é fornecida pela interpretação 
da probabilidade por meio de frequências. Essa interpretação (que é parcialmen- 
te justificada pela lei forte dos grandes números, a ser apresentada no Capítulo 
8), supõe que, se uma sequência infinita de repetições independentes de um ex- 
perimento é realizada, então, para qualquer evento E, a proporção de vezes que 
E ocorre será P(E). Agora, considere uma variável aleatória que deve receber 
um dos valores x,, x,,...,x, com respectivas probabilidades p(x,), p(x,)...., p(x,), € 
pense em X como se representasse nossas vitórias em um único jogo de azar. Isto 
é, com probabilidade p(x,) vamos vencer x, unidades i = 1,2.,...,n. Pela interpre- 
tação de frequência, se jogarmos esse jogo continuamente, então a proporção de 
vezes na qual ganhamos x, será p(x,). Como isso é verdadeiro para todo i,i = 1, 
2,...,n,0 valor médio de nossas vitórias por jogo será 


Do xip(x) = EX] 


i=1 


Exemplo 3a 


Determine E[X], onde X é o resultado que obtemos quando rolamos um dado 
honesto. 


Solução Como p(1) = p(2) = p(3) = p(4) = p(5) = p(6) = é, obtemos 
eui=1(5) + 2(5) + 3(5) + s(5) + (3) + JE Es 
Ra: 6 6 6 6 6) 2o 


Exemplo 3b 
Dizemos que / é uma variável indicadora do evento A se 


fim 1 se À ocorre 
“140 se Aº ocorre 


Determine E[1). 
Solução Como p(1) = P(A), p(0) = 1 - P(A), temos 


EM = P(A) 
Isto é, o valor esperado da variável indicadora do evento A é igual à probabili- 
dade de ocorrência de 4. | 
Exemplo 3c 


Um competidor em um jogo de perguntas e respostas recebe duas questões, 1 
e 2, às quais tentará responder na ordem que preferir. Se ele decidir tentar a 
questão i primeiro, então ele poderá passar à questão j,;  i, somente se a sua 
resposta para a questão i estiver correta. Se a sua resposta inicial estiver incor- 
reta, ele não poderá responder à outra questão. O competidor receberá V, reais 
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se responder à questão i corretamente, i = 1,2. Por exemplo, ele irá receber V, 
+ V, reais se responder a ambas as questões corretamente. Se a probabilidade 
de que ele saiba a resposta da questão i é P, i = 1,2, que questão ele deveria 
tentar responder primeiro de forma a maximizar sua esperança de vitórias? Su- 
ponha que os eventos E, i = 1,2, em que ele conheça a resposta para a questão 
i sejam independentes. 

Solução Por um lado, se ele tentar responder à questão 1 primeiro, ele ganhará 


0 com probabilidade 1 — P; 
V, com probabilidade P;(1 — P5) 
Vi + V> com probabilidade P,P; 


Assim, sua esperança de vitória é, nesse caso, 
vira -P,) + (V, + V)P,P, 


Por outro lado, se ele tentar responder à questão 2 primeiro, sua esperança de 
vitórias será 


VPOA-P)+(V, + V)P,P, 
Portanto, é melhor tentar responder à questão 1 primeiro se 
VPRG-P)=VP(A-P) 
ou, equivalentemente, se 


Madi as Vabo 
1-P 1-P 


Por exemplo, se ele está 60% certo de responder corretamente à questão 1, 
que vale R$200, e 80% certo de responder corretamente à questão 2, que vale 
R$100, então ele deve tentar responder à questão 2 primeiro porque 


(100)(0,8)  (200)(0,6) = 300 


400 = Astral 
di 02 ” 04 o 


Exemplo 3d 


Uma turma com 120 estudantes é levada em 3 ônibus para a apresentação de 
uma orquestra sinfônica. Há 36 estudantes em um dos ônibus, 40 no outro e 44 
no terceiro ônibus. Quando os ônibus chegam, um dos 120 estudantes é esco- 
lhido aleatoriamente. Suponha que X represente o número de estudantes que 
vieram no mesmo ônibus do estudante escolhido e determine E[X]. 


Solução Como o estudante escolhido aleatoriamente pode ser, com mesma 
probabilidade, qualquer um dos 120 estudantes, tem-se que 
36 40 44 


PX=39- PH=0)= PX=4)=5 
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oc o O 
—-1 0 Al 2 


p(-1) = 0,10, p(0) = 0,25, p(1) = 0,30, p(2) = 0,35 


a = centro de gravidade = 0,9 


Figura 4.4 


Com isso, 


3 1 11) 1208 
= = = = 4 
EIX] = 36 (53) + 40 (5) +44 (5) = 0 = 40:2667 


Entretanto, o número médio de estudantes em um ônibus é 120/3 = 40, o que 
mostra que o número esperado de estudantes no ônibus de onde foi escolhido 
aleatoriamente um estudante é maior do que o número médio de estudantes 
em um ônibus. Este é um fenômeno geral, que ocorre porque, quanto mais es- 
tudantes houver dentro de um ônibus, mais provável é que um estudante esco- 
lhido aleatoriamente esteja naquele ônibus. Como resultado, ônibus com mui- 
tos estudantes recebem um peso maior do que aqueles com menos estudantes 
(veja Problema de Autoteste 4.4). [| 


Observação: O conceito de esperança na probabilidade é análogo ao con- 
ceito físico de centro de gravidade de uma distribuição de massas. Considere 
uma variável aleatória discreta X com função de probabilidade p(x,), i > 1. Se 
agora imaginamos uma haste sem peso na qual pesos com massa p(x,;), i > 1, 
estejam localizados nos pontos x,, i = 1 (veja Figura 4.4), então o ponto no qual 
a haste estaria em equilíbrio é conhecido como centro de gravidade. Para os 
leitores familiarizados com estatística elementar, agora é simples mostrar que 
este ponto está em E[X].* n 


4.4 ESPERANÇA DE UMA FUNÇÃO DE UMA VARIÁVEL ALEATÓRIA 


Suponha que conheçamos uma variável aleatória discreta e sua função de pro- 
babilidade e que queiramos calcular o valor esperado de alguma função de X, 
digamos, g(X). Como podemos fazer isso? Uma maneira é a seguinte: como 
g(X) é ela mesmo uma variável aleatória discreta, ela tem uma função de pro- 
babilidade, que pode ser determinada a partir da função de probabilidade de 
X. Uma vez que tenhamos determinado a função de probabilidade de g(X) 
podemos calcular E[g(x)] usando a definição de valor esperado. 


> 


* Para provar isso, devemos mostrar que a soma dos torques tendendo a fazer a haste gi- 
rar em torno de E[X] é igual a 0. Isto é, devemos mostrar que O = nt — ELXDp(x;), 
o que é imediato. 
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Exemplo 4a 


Seja X uma variável aleatória que pode receber os valores —1,0 e 1 com respec- 
tivas probabilidades 


P(X=-1]=02 P|X=0]-=05 P(X=1]=03 
Calcule E[X”]. 
Solução Seja Y = Xº. Então a função de probabilidade de Y é dada por 


Ply=1)=PlX=-1)+P[X=1)=05 
PY=0)=P|X=0)=0,5 


Logo, 
ELX”] = E[Y] = 1(0,5) + 0(0,5) = 0,5 
Observe que 
0,5 = E[X] £ (E[X]) = 0,01 n 


Embora o procedimento anterior sempre nos permita calcular o valor espe- 
rado de qualquer função de X a partir do conhecimento da função de probabili- 
dade de X, há uma outra maneira de raciocinar sobre Elg(X)]: já que g(X) será 
igual a g(x) sempre que X for igual a x, parece razoável que E[g(X)] deva ser 
uma média ponderada dos valores g(x), com g(x) sendo ponderado pela proba- 
bilidade de que X seja igual a x. Isto é, o resultado a seguir é bastante intuitivo: 


Proposição 4.1 
Se X é uma variável aleatória discreta que pode receber os valores x, i = 1,com 
respectivas probabilidades p(x,), então, para qualquer função real g, 


Elg0O] = >  gGp() 


Antes de demonstrar essa proposição, vamos verificar se ela está de acordo 
com os resultados do Exemplo 4a. Aplicando-a naquele exemplo, temos 


E(X) = (—1)(0,2) + 00,5) + 140,3) 
= 1(0,2 + 0,3) + 0(0,5) 
=0,5 
o que está de acordo com o resultado dado no Exemplo 4a. 


Demonstração da Proposição 4.1: A demonstração da Proposição 4.1 prosse- 
gue, assim como na verificação anterior, com o agrupamento de todos os termos 


em > g(x;)p(x;) com o mesmo valor de g(x,). Especificamente, suponha que y,, 
i 
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j = 1,represente os diferentes valores de g(x,), i = 1. Então, o agrupamento de 
todos os g(x,) com valores iguais resulta em 


A ustdpe) =, > godp(s) 


1 igO)=y; 


=5 5 vpG 
j igOD)=y; 


Es > pl) 


PgOD)=y; 


= Es PlvO = Yj) 
j 
= Elg(X)] o 


Exemplo 4b 


Um produto que é vendido sazonalmente resulta em um ganho líquido de b 
reais para cada unidade vendida e em uma perda líquida de € reais para cada 
unidade que não tenha sido vendida no final da temporada. O número de uni- 
dades do produto pedido em uma loja de departamentos específica durante 
qualquer estação do ano é uma variável aleatória que tem função de proba- 
bilidade p(i), i > 0. Se a loja deve estocar esse produto com antecedência, 
determine o número de unidades que a loja deveria estocar para maximizar 
seu lucro esperado. 


Solução Seja X o número de unidades pedidas. Se s unidades são estocadas, 
então o lucro — chame-o de P(s) — pode ser representado como 


P(s)=bX-(s-X)€ seX=<s 
= sb seX>s 


Assim, o lucro esperado é igual a 


EIP(9)] = > Ibi — (s — Dep) + 3 sbp(d) 
i=0 i=s41 
=(b+OD ip -s> p()+sb ' = Evo | 
i=0 i=0 i=0 


=(b+0D> ip -(b+ospm+s 


i=0 i=0 


=sb + (b+ 0 — sp) 


i=0 
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Para determinar o valor ótimo de s, investiguemos o que acontece com o lucro 
quando aumentamos s em 1 unidade. Por substituição, vemos que o lucro espe- 
rado é neste caso dado por 


s+1 
EP +DI=bS+D+6b+OS-s- Dp6) 
i=0 


=b(s+D+b+O>-s-— Dp() 
i=0 


Portanto, 


E[P( + D] — EIPO)]=b — b + 05 pl 
i=0 


Assim, estocar s + 1 unidades será melhor que estocar s unidades sempre que 


s 

) b 
EO e 
i=0 


(4.1) 


Como o lado esquerdo da Equação (4.1) aumenta com s enquanto o lado di- 
reito é constante, a desigualdade será satisfeita para todos os valores de s = s*, 
onde s* é o maior valor de s satisfazendo a Equação (5.1). Como 


E[P(O)] < --- < E(P(s9] < E[P(S* + D] > E[P(s* + D] > 
tem-se que estocar s* + 1 itens levará ao lucro máximo esperado. O 


Exemplo 4c Utilidade 


Suponha que você deva escolher uma dentre duas ações possíveis, cada uma de- 
las podendo levar a qualquer uma de n consequências, representadas por C,...., 
€C,: Suponha que, se a primeira ação for escolhida, então tenhamos a conse- 
quência €C, com probabilidade p, i = 1,...,n. Por outro lado, se a segunda ação 
for escolhida, teremos a consequência €, com probabilidade g, i = 1,...,n, onde 
> pi = >) q; = 1.A abordagem a seguir pode ser usada para determinar qual 
Ss dev Ends escolher: comece atribuindo valores numéricos para as diferentes 
consequências da seguinte maneira: primeiro, identifique as consequências mais 
e menos desejadas — chame-as de € e c, respectivamente; dê à consequência c o 
valor O e à conseguência € o valor 1. Agora, considere qualquer uma das demais 
n — 2 consequências, digamos, €,. Para dar um valor a essa consequência, imagi- 
ne que você tenha a opção de receber C, ou de participar de um experimento 
aleatório que lhe dá a consequência €C com probabilidade u ou a consequência c 
com probabilidade 1 — u. Claramente, sua escolha dependerá do valor de u. Por 
outro lado, se u = 1, então o experimento certamente resultará na consequência 
C,e como € é a consequência mais desejável, você preferirá participar do expe- 
rimento a receber C,. Por outro lado, se u = 0, então o experimento irá resultar 
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na consequência menos desejável — isto é, c — então neste caso você preferirá a 
consequência €, a participar do experimento. Agora, como u decresce de 1 a 0, 
parece razoável que sua escolha, em algum ponto, mude de participar do expe- 
rimento para obter €, em retorno, e que neste ponto crítico de transição você 
fique indiferente entre as duas alternativas. Tome a probabilidade de indiferença 
u como o valor da consequência C,. Em outras palavras, o valor de C, é a proba- 
bilidade u de que lhe seja indiferente receber a consequência C, ou participar de 
um experimento que retorne a consequência €C com probabilidade u ou a conse- 
quência c com probabilidade 1 — u. Chamamos esta probabilidade de indiferença 
de utilidade da consequência C, e a designamos u(C,). 

Para determinar qual das ações é superior, precisamos avaliar cada uma delas. 
Considere a primeira ação, que resulta na consequência €, com probabilidade 
Pai = 1,...,n. Podemos pensar no resultado desta ação como sendo determi- 
nado por um experimento em duas etapas. Na primeira etapa, um dos valores 
1,...,n é escolhido de acordo com as probabilidades p,,..., p,; se o valor i for 
escolhido, você recebe a consequência €,. Entretanto, como C, é equivalente a 
obter a consequência € com probabilidade u(C;) ou a consequência c com pro- 
babilidade 1 — u(C;), tem-se que o resultado do experimento de duas etapas é 
equivalente a um experimento no qual se obtêm as consequências C ou c, com 
€ sendo obtido com probabilidade 


>pu(C) 
i=1 


Da mesma maneira, o resultado de escolher a segunda ação é equivalente a 
participar de um experimento no qual se obtêm as consequências € ou c, com 
€ sendo obtido com probabilidade 


Di qu(C) 
i=1 


Como C é preferível a c, segue-se que a primeira ação é preferível à segunda 
ação se 


Dopu(C) > > qu(C) 
i=1 i=1 


Em outras palavras, o benefício de uma ação pode ser medido pelo valor espe- 
rado da utilidade de sua consequência, e a ação com a maior utilidade esperada 
é a mais preferível. E 


Uma consequência lógica simples da Proposição 4.1 é o Corolário 4.1. 


Corolário 4.1 Seaebsão constantes, então 


ElaX + b]) = aE(X] + b 


168 


Probabilidade: Um Curso Moderno com Aplicações 


Demonstração 
E[aX + b]= >. (ax + b)p(x) 
x:p(Q)>0 
=a Do xl) +b 5 po) 
x:p(x)>0 x:p(x)>0 
=aE[X] + b [o 


O valor esperado de uma variável aleatória X, E[X], também é chamado 
de média ou primeiro momento de X. A grandeza E[X"|,n = 1, é chamada de 
n-ésimo momento de X. Pela Proposição 4.1, observamos que 


EMX'|= 5, *"p6) 


x:p(x)>0 


4.5 VARIÂNCIA 


Dada uma variável aleatória X e sua função distribuição F, seria extremamente 
útil se pudéssemos resumir as propriedades essenciais de F em certas medidas 
convenientemente definidas. Uma dessas medidas seria E[X], o valor esperado 
de X. Entretanto, embora E[X] forneça a média ponderada dos valores possí- 
veis de X, ela não nos diz nada sobre a variação, ou dispersão, desses valores. 
Por exemplo, embora as variáveis aleatórias W, Y e Z com funções discretas de 
probabilidade determinadas por 


W=0 com probabilidade 1 
—1 com probabilidade 5 


+1 com probabilidade 3 


—100 com probabilidade 5 
+100 com probabilidade 3 


tenham todas a mesma esperança — que é igual a O — existe uma dispersão muito 
maior nos valores possíveis de Y do que naqueles de W (que é uma constante) 
e nos valores possíveis de Z do que naqueles de Y. 

Como esperamos que X assuma valores em torno de sua média E[X], parece 
razoável que uma maneira de medir a possível variação de X seja ver, em mé- 
dia, quão distante X estaria de sua média. Uma possível maneira de se medir 
essa variação seria considerar a grandeza E[|X — u|], onde u = E[X]. Entretan- 
to, a manipulação dessa grandeza seria matematicamente inconveniente. Por 
esse motivo, uma grandeza mais tratável é usualmente considerada — esta é a 
esperança do quadrado da diferença entre X e sua média. Temos assim a defi- 
nição a seguir. 
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Definição 


Se X é uma variável aleatória com média q, então a variância de X, repre- 
sentada por Var(X), é definida como 


Var(X) = EUX — 1] 


Uma fórmula alternativa para Var(X) é deduzida a seguir: 
Var(X) = EX — wu?) 
=> (4 — u/po) 
X 


= 50º — 2ux + ubp() 
= 535 2p() — 245 xp6o) + vu? 5 pl) 
=EX]-2u + wu 
E E[X?] às u2 
Isto é, 


Var(X) = E[X?] — (EIX)? 


Ea a gi 2 
Colocando em palavras, a variância de X é igual ao valor esperado de Xº menos 
o quadrado de seu valor esperado. Na prática, esta fórmula frequentemente 
oferece a maneira mais fácil de calcular Var(X). 


Exemplo 5a 
Calcule Var(X) se X representa o resultado de um dado honesto. 


Solução Foi mostrado no Exemplo 3a que E[X] = i. Também, 
1 1 1 1 1 1 
EN =12 (E a2(+ 2 (- a2t> 2/1 2(+ 
Ec) (5) 6 6 dad (o aid 
1 
=(-|(91 
(5) om 
Com isso, 


91 732, 35 


Uma identidade útil é que, para quaisquer constantes a e Db, 


Var(aX + b) = aVar(X) 
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Para provar essa igualdade, considere u = E[X],e observe do Corolário 4.1 que 
ElaX + b] = au + b. Portanto, 


Var(aX + b) = El(aX + b — au — b2] 
= E[o(X — wu) 
= 2EMX — w?) 
= q Var(X) 


Observações: (a) Assim como a média é análoga ao centro de gravidade 
de uma distribuição de massas, a variância representa, na terminologia da me- 
cânica, o momento de inércia. 

(b) A raiz quadrada de Var(X) é chamada de desvio padrão de X, represen- 
tado por SD(X), que é uma abreviatura do inglês standard deviation. Isto é, 


SD(X) = V Var(X) 


Variáveis aleatórias discretas são frequentemente classificadas de acordo 
com suas funções de probabilidade. Nas próximas seções, consideramos alguns 
dos tipos mais comuns. 


4.6 AS VARIÁVEIS ALEATÓRIAS BINOMIAL E DE BERNOULLI 


Suponha que um experimento ou tentativa cujo resultado possa ser classificado 
como um sucesso ou um fracasso seja realizado. Se X = 1 quando o resultado é 
um sucesso e X = O quando é um fracasso, então a função de probabilidade de 
X é dada por 


p(O)=PMX=0)=1-p 


pD=PX=1)=p (6) 


onde p,0 = p = 1,é a probabilidade de que a tentativa seja um sucesso. 

Uma variável aleatória X é chamada de variável aleatória de Bernoulli (em 
homenagem ao matemático suíço James Bernoulli) se sua função de probabili- 
dade for dada pelas Equações (6.1) para algum p E (0,1). 

Suponha agora que n tentativas independentes, cada uma das quais com 
probabilidade de sucesso p e probabilidade de fracasso 1 — p, sejam realizadas. 
Se X representa o número de sucessos que ocorrem nas n tentativas, então diz- 
se que X é uma variável aleatória binomial com parâmetros (n, p). Assim, uma 
variável aleatória de Bernoulli é tão somente uma variável aleatória binomial 
com parâmetros (1,p). 

A função de probabilidade de uma variável aleatória binomial com pará- 
metros (n,p) é dada por 


p(i) = ()ria PE) ad i=0,1,...,n (6.2) 
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A validade da Equação (6.2) pode ser verificada primeiro notando-se que a 
probabilidade de qualquer sequência particular de n resultados contendo i su- 
cessos e n — i fracassos é, pela independência que se supõe para as tentativas, 


p(1 - p)”. Tem-se então como resultado a Equação (6.2), já que há ( E ) dife- 


rentes sequências de n resultados levando a i sucessos e n — i fracassos. Isso tal- 
: s : (ny: 
vez possa ser visto mais facilmente notando-se que há ( ; ) diferentes escolhas 


de i tentativas que resultam em sucessos. Por exemplo, se n = 4,i = 2, então 


há(5 


2 )= 6 maneiras pelas quais as quatro tentativas podem resultar em dois 


sucessos, isto é, qualquer um dos resultados (s,s,f,f, (s,f,s,P. (s.ff,s). (f,s,5, 
PD. (f,s,f,5) e (f,f,5,5), onde o resultado (s, s, f, f) significa, por exemplo, que as 
primeiras duas tentativas são sucessos e as duas últimas, fracassos. Como cada 
um desses resultados tem probabilidade p(1 - p)? de ocorrer, a probabilidade 


desejada de dois sucessos nas quatro tentativas é À Pa -p). 
Note que, pelo teorema binomial, a soma das probabilidades é igual a 1; 
isto é, 


> po=>(ni)pa-pri=p+a-pr=1 


i=0 i=0 


Exemplo 6a 


Cinco moedas honestas são jogadas. Se os resultados são por hipótese indepen- 
dentes, determine a função de probabilidade do número de caras obtido. 


Solução Se X é igual ao número de caras (sucessos) que aparecem, então X 
é uma variável aleatória binomial, com parâmetros (n = 5,p = 1/2). Portanto, 


pela Equação (6.2), 
NAN 
rec=o=(5)(5) (5) = 52 


neco(D0)Q) 5 
rea (DO(S 
ne () = 
neca()0)() = 
mB 
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Exemplo 6b 


Sabe-se que os parafusos produzidos por certa empresa têm probabilidade de 
0,01 de apresentar defeitos, independentemente uns dos outros. A empresa 
vende os parafusos em pacotes com 10 e oferece uma garantia de devolução 
de dinheiro se mais de 1 parafuso em 10 apresentar defeito. Que proporção de 
pacotes vendidos a empresa deve trocar? 


Solução Se X é o número de parafusos defeituosos em um pacote, então X é 
uma variável aleatória binomial com parâmetros (10, 0,01). Portanto, a proba- 
bilidade de que um pacote deva ser trocado é de 


1-P(X=0)-PlX=1)=1- ( E ) (0,01(0,99)º — ( o ) (0.01)'(0,99)º 


= 0,004 
Assim, apenas 0,4% dos pacotes devem ser trocados. [a 


Exemplo 6c 


O jogo de azar descrito a seguir, conhecido como roda da fortuna, é bastante popu- 
lar em muitos parques de diversões e cassinos. Um jogador aposta em um número 
de 1 a 6. Três dados são então lançados, e se o número apostado sair i vezes, i = 1, 
2,3, então o jogador ganha i unidades; se o número apostado não sair em nenhum 
dos dados, então o jogador perde 1 unidade. Este jogo é justo para o jogador? (Na 
realidade, o jogo é jogado: girando-se uma roleta que cai em um número de 1 a 6, 
mas essa variante é matematicamente equivalente à versão dos dados.) 


Solução Se consideramos que os dados são justos e que agem independente- 
mente uns dos outros, então o número de vezes que o número apostado apa- 
rece é uma variável aleatória binomial com parâmetros (3, 8) Portanto, se X 


representa o número de vitórias do jogador neste jogo, temos 


nea(0 (0) E 
neco(D() (Jo 
neo) ( 
nec) (at 


Para determinar se este jogo é justo ou não para o jogador, vamos calcular 
E[X]. Das probabilidades anteriores, obtemos 
-125 +75 +30+3 


dio 216 


—17 
216 
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Com isso, a longo prazo, o jogador perderá 17 unidades a cada 216 jogos que 
jogar. O 


No próximo exemplo, consideramos a forma mais simples da teoria da he- 
rança desenvolvida por Gregor Mendel (1822-1884). 


Exemplo 6d 

Suponha que um determinado traço (como a cor do olho ou a habilidade com 
a mão esquerda) de uma pessoa seja classificada com base em um par de ge- 
nes, e suponha também que d represente um gene dominante e r um gene 
recessivo. Assim, uma pessoa com dd genes é puramente dominante, uma com 
rr é puramente recessiva e uma com rd é híbrida. Os indivíduos puramente 
dominantes e os indivíduos híbridos têm a mesma aparência. Filhos recebem 
1 gene de cada pai. Se, com respeito a um traço em particular, 2 pais híbridos 
têm um total de 4 filhos, qual é a probabilidade de que 3 dos 4 filhos tenham a 
aparência do gene dominante? 


Solução Se consideramos a hipótese de que cada filhos tem a mesma pro- 
babilidade de herdar um dos 2 genes de cada pai, as probabilidades de que os 
filhos de 2 pais híbridos tenham dd, rr e rd pares de genes são, respectivamente, 
de 1 1 e 1. Com isso, como um filho terá a aparência externa do gene dominante 
se seu par de genes for dd ou rd, tem-se que o número de filhos com essas ca- 
racterísticas é distribuído binomialmente com parâmetros (4, à) Assim, a pro- 


babilidade desejada é 

GN ANE do 

3/14 4a) 64 a 
Exemplo 6e 


Considere um julgamento em que são necessários 8 dos 12 jurados para que 
o réu seja condenado; isto é, para que o réu seja condenado, pelo menos 8 dos 
12 jurados devem votar em sua culpa. Se supomos que os jurados ajam inde- 
pendentemente e que, sendo o réu culpado ou não, cada um tome a decisão 
correta com probabilidade 0, qual é a probabilidade de que o júri acerte em 
sua decisão? 


Solução O problema, conforme enunciado, não tem solução, pois ainda não 
há informações suficientes. Por exemplo, se o réu é inocente, a probabilidade de 
os jurados tomarem a decisão correta é 


12 


» ( E ) gia — qi 
i=5 
Por outro lado, se ele for culpado, a probabilidade de uma decisão correta é 


12 
o ( A 9“ e g)12-i 


i=8 
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Portanto, se « representa a probabilidade de o réu ser culpado, então, condicio- 
nando no fato de ele ser culpado ou não, obtemos a probabilidade de que o júri 
tome uma decisão correta: 


2/1 2/19 
i 12-i i 12-i 
>( , Joia = ist -o( : )oa - 0) 
i=8 i=5 ] 
Exemplo 6f 
Um sistema de comunicação é formado por n componentes, cada um dos 
quais irá, independentemente, funcionar com probabilidade p. O sistema to- 
tal funciona de forma efetiva se pelo menos metade de seus componentes 
também funcionar. 
(a) Para que valores de p um sistema com 5 componentes tem maior probabi- 
lidade de funcionar corretamente do que um valor de 3 componentes? 
(b) Em geral, quando um sistema de (2k + 1) componentes é melhor do que 
um sistema com (2k — 1) componentes? 


Solução (a) Como o número de componentes em funcionamento é uma 
variável aleatória binomial com parâmetros (n, p), tem-se que 
a probabilidade de que um sistema de 5 componentes seja efe- 
tivo é 


(3)ra - p? + (ara -“-pD+p 


enquanto a probabilidade correspondente para um sistema de 3 
componentes é 


3 
(2)ra = pas p 
Portanto, o sistema de 5 componentes é melhor se 
1091 -p) + sp -p)+p'>3pA1-p)+p' 
que se reduz para 
3(p-1N(2p-1)>0 


ou 


sê 
Pesa 


(b) Em geral, um sistema com 2k + 1 componentes será melhor do 
que um com 2k — 1 componentes se (e somente se) p > ê. Para 
demonstrar isso, considere um sistema com 2k + 1 componentes 
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e suponha que X represente o número dos primeiros 2k — 1 com- 
ponentes que funcionam. Então, 


P,n(efetivos) = PXzk+U+PX=KHA-(1-p) 
+PlX=k-1p 
o que procede porque um sistema com (2k + 1) componentes 


será efetivo se 


(1) Xzk+1; 
(ii) X = k e pelo menos um dos 2 componentes restantes fun- 
cionar; ou 
(ii) X=k-1 e os2 próximos componentes funcionarem. 
Já que 
Pou-i(efetivos) = P(X = k) 
=PX=k)+ PX=k+1) 
obtemos 
Popsi(efetivos) — Pow 1 (efetivos) 
=P(X=k-Ip-(-pPX=k) 


E ( Re - pp? — q — (XT ra E 
” ias Dra - pp - - pljáque (E) = (Ho ) 


1 
do A 


4.6.1 Propriedades das variáveis aleatórias binomiais 


Vamos agora examinar as propriedades de uma variável aleatória binomial 
com parâmetros n e p. Para começar, vamos calcular o seu valor esperado e sua 
variância. Então, 


EL] => (7)ria -— pr 


i=0 

de . . 
Eat) = pro 

i=1 


Usando a identidade 
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temos 
- n— 11; ; 
EIXM Es Ds ( ni Jota no pira 
i=1 
no meliante ide fazendo-se 
=np> 6 + DE ( E )ria pre pet 
j=0 


= npE(Y + 181) 


onde Y é uma variável aleatória binomial com parâmetros n — 1, p. Fazendo k = 
1 na equação anterior, temos 


EIX] = np 
Isto é, o número esperado de sucessos que ocorrem em n tentativas indepen- 
dentes, quando cada uma dessas tentativas tem probabilidade de sucesso p, é 
igual a np. Fazendo k = 2 na equação anterior e usando a fórmula precedente 
para o valor esperado de uma variável aleatória binomial, temos 
E[X?] = npE(Y + 1] 
=npl(n — Dp + 1] 
Como E[X] = np, obtemos 
Var(X) = E[X?] — (E(X)? 

= npl(n — Dp + 1] — (np? 

=np(l — p) 
Em resumo, mostramos o seguinte: 

Se X é uma variável aleatória binomiai com parâmetros n e p, então 
EX] = np 
Var(X) = np(l — p) 


A proposição a seguir detalha como a função de probabilidade binomial 
primeiro cresce e depois decresce. 


Proposição 6.1 Se X é uma variável aleatória binomial com parâmetros (n, p), 
onde 0 < p < 1, então à medida que k varia de O a n, PLX = k) primeiro cresce 
monotonicamente e depois decresce monotonicamente, atingindo seu maior 
valor quando k é o maior inteiro menor ou igual a (n + Dp. 
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Demonstração Demonstramos a proposição considerando P(X = k)/ 
P(X = k — 1] e determinando para que valores de k essa expressão é 
maior ou menor que 1. Então, 


n! 


R k n—k 
PX=k m> qua? 4 - P) 
PX=k- 19 n! KA O an-k+l 
nen” (-? 
a (n— k+ Dp 


KG — p) 
Portanto, PIX = k| = PIX = k —1) se e somente se 
(n-k+Dp=k(-p) 
ou, equivalentemente, se e somente se 
k=(n+Dp 
e a proposição está demonstrada. E 


Como uma ilustração da Proposição 6.1, considere a Figura 4.5, que corres- 
ponde ao gráfico da função de probabilidade de uma variável aleatória bino- 
mial com parâmetros (10, 5). 


1024 x p(k) 
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Exemplo 6g 


Em uma eleição presidencial nos EUA, o candidato que ganha o maior número 
de votos em um estado é premiado com o número total de votos do colégio 
eleitoral daquele estado. O número de votos do colégio eleitoral de um deter- 
minado estado é proporcional à população daquele estado — isto é, um estado 
com população n tem aproximadamente nc votos no colégio eleitoral (na rea- 
lidade, esse número é mais próximo de nc + 2, já que cada estado tem direito 
a um voto para cada um de seus membros na Casa dos Representantes, com o 
número desses representantes sendo aproximadamente proporcional à popula- 
ção do estado, e um voto no colégio eleitoral para cada um de seus senadores). 
Vamos determinar o poder médio de um cidadão americano em um estado de 
tamanho n na proximidade de uma eleição presidencial, onde, por poder médio 
na proximidade de uma eleição, queremos dizer que um eleitor em um estado 
de tamanho n = 2k + 1 será decisivo se os outros n — 1 eleitores dividirem seus 
votos igualmente entre os dois candidatos (supomos aqui que n seja ímpar, mas 
o caso em que n é par é bastante similar). Como a eleição está próxima, vamos 
supor que cada um dos outros n — 1 = 2k eleitores aja independentemente, e que 
possa, com mesma probabilidade, votar em qualquer um dos candidatos. Com 
isso, a probabilidade de que um eleitor em um estado de tamanho n = 2k + 1 
faça a diferença no resultado é igual à probabilidade de que 2k jogadas de uma 
moeda honesta resultem em cara e coroa um mesmo número de vezes. Isto é, 


Pfeleitor em um estado de tamanho 2k + 1 faça a diferença) 
(A k uk 
=(:)(5) (5) 
2H)! 
kkk 


Para aproximar a igualdade anterior, utilizamos a aproximação de Stirling, que 
diz que, para k grande, 


kt W+H2e-k 27 


onde dizemos que a, - b, quando a razão a,/b, tende a 1 à medida que k tende 
a oo, Com isso, tem-se que 


Pleleitor em um estado de tamanho 2k + 1 faça a diferença) 
Cp a E 
Re (Dm) kn 
Como tal eleitor (se ele ou ela fizerem a diferença) afetará nc votos do colégio 


eleitoral, o número esperado de votos que um eleitor em um estado de tama- 
nho n poderá afetar —- ou o poder médio do eleitor — é dado por 


poder médio = ncPlfazer a diferença) 
nc 


nn/2 


=cv2n/n 


es 


i 
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Assim, o poder médio de um eleitor em um estado de tamanho n é proporcio- 
nal à raiz quadrada de n, o que mostra que, em eleições presidenciais, eleitores 
em estados maiores têm maior poder do que aqueles em estados menores. E 


4.6.2 Calculando a função distribuição binomial 


Suponha que X seja binomial com parâmetros (n, p). A chave para calcular a 
sua função distribuição 
i 


P(X <= a=D(K)ra - pro i=0,1,...,n 


k=0 


é utilizar a seguinte relação entre P(X = k + 1) e P(X = k), que foi estabelecida 
na demonstração da Proposição 6.1: 


PX=adi= — 


P(X =k 
PI ) 


(6.3) 


Exemplo 6h 


Seja X uma variável aleatória binomial com parâmetros n = 6,p = 0,4. Então, 
começando com P(X = 0) = (0,6) e empregando recursivamente a Equação 
(6.3), obtemos 


P(X =0) = (0,6 = 0,0467 


PX=1|= COPIX = 0) = 0,1866 

PiX=9]= SPU = =1) = 0,3110 

PX=3= SPU = 2) = 0,2765 
43 

P(X =4) = SPIX =3) = 0,1382 

PX =5|= SPU =4) = 0,0369 


P(X =6= sGPUE = 5) = 0,0041 E 

Pode-se escrever facilmente um programa de computador utilizando a 

fórmula recursiva (6.3) para calcular a função distribuição de probabilidade 

binomial. Para calcular P(X = i),o programa deve primeiro calcular P(X = 

ij e então usar a fórmula recursiva para calcular sucessivamente P[X = i-1), 
P(X = i — 2),e assim por diante. 
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E 
Nota histórica 


Tentativas independentes com uma mesma probabilidade de sucesso p fo- 
ram estudadas pela primeira vez pelo matemático suíço Jacques Bernoulli 
(1654-1705). Em seu livro Ars Conjectandi (A Arte da Conjectura), publi- 
cado por seu sobrinho Nicholas oito anos depois de sua morte em 1713, 
Bernoulli mostrou que se o número de tais tentativas fosse grande, então 
a proporção de tentativas bem-sucedidas se aproximaria de p com uma 
probabilidade próxima de 1. 

Jacques Bernoulli foi da primeira geração da mais famosa família de 
matemáticos de todos os tempos. Juntos, existiram entre 8 e 12 Bernoullis, 
espalhados em três gerações, que fizeram contribuições fundamentais para 
a probabilidade, a estatística e a matemática. A dificuldade em determinar- 
se o número exato de Bernoullis que existiram está no fato de que vários 
deles tiveram nomes iguais (por exemplo, dois dos filhos do irmão de Jac- 
ques, Jean, ganharam os nomes de Jacques e Jean). Outra dificuldade é que 
vários dos Bernoullis eram conhecidos por nomes diferentes em diferentes 
lugares. Nosso Jacques (às vezes escrito como Jaques) era, por exemplo, 
conhecido como Jakob (às vezes escrito como Jacob) e como James Ber- 
noulli. Mas o número de Bernoullis não importa. Sua influência e os re- 
sultados que obtiveram foram prodigiosos. Como os Bach na música, os 
Bernoullis formaram na matemática uma família eterna! 


Exemplo 6i 


Se X é uma variável aleatória binomial com parâmetros n = 100 e p = 0,75, 
determine P[X = 70) e P(X = 70). 


Solução A resposta é mostrada na Figura 4.6. 


Distribuição Binomial 


Entre valor para p[0,75 | 
Entre valor para n[100 | 


Entre valor para i|70 


Probabilidade (Número de Sucessos l 0,04575381 
Probabilidade (Número de Sucessos < i 0,14954105 


Figura 4.6 
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4.7 AVARIÁVEL ALEATÓRIA DE POISSON 


Uma variável aleatória X que pode assumir qualquer um dos valores 0, 1,2... é 
chamada de variável aleatória de Poisson com parâmetro À se, para algum À > 0, 


x 
pO=PX=j=e"s i=0,1,2,... (71) 
A Equação (71) define uma função de probabilidade, já que 
[0.0] [0.0 A 
A 4 E op 
>pú-e ae e“=1 
i=0 i=0 


A distribuição de probabilidades de Poisson foi introduzida por Siméon Denis 
Poisson em um livro que escreveu a respeito da aplicação da teoria da probabi- 
lidade a processos, julgamentos criminais e similares. O título do livro, publica- 
do em 1837 era Recherches sur la probabilité de jugements en matiêre criminelle 
et en matiêre civile (Investigações sobre a probabilidade de veredictos em maté- 
rias criminal e civil). 

A variável aleatória de Poisson encontra uma tremenda faixa de aplicações 
em diversas áreas porque pode ser usada como uma aproximação para a variá- 
vel aleatória binomial com parâmetros (n, p) no caso particular de n grande e p 
suficientemente pequeno para que np tenha tamanho moderado. Para ver isto, 
suponha que X seja uma variável aleatória binomial com parâmetros (n, p), e 
suponha que À = np. Então, 


- n! ia o ni 
PX=i= Pp) 


z n! A E À n-i 
“dn - di! (1) E -) 


nn Don>i+ DAMA Am 
= n' td aA/n) 


Agora, para n grande e À moderado, 


(1-5) me A (1-5) = 1 


n n' 


Portanto, para n grande e À moderado, 


A 
PX=)xel E 
Em outras palavras, se n tentativas independentes são realizadas, cada uma 
com probabilidade de sucesso p, então quando n é grande e p é pequeno o sufi- 
ciente para fazer np moderado, o número de sucessos que ocorrem é aproxima- 
damente uma variável aleatória de Poisson com parâmetro À = np. Este valor 
A (que mais tarde mostraremos ser igual ao número esperado de sucessos) será 
normalmente determinado de forma empírica. 
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Alguns exemplos de variáveis aleatórias que geralmente obedecem à lei 
de probabilidades de Poisson [isto é, que obedecem à Equação (7.1)] são dados 
a seguir: 


1. O número de erros de impressão em uma página (ou em um grupo de pági- 
nas de um livro) 


2. O número de pessoas em uma comunidade que vivem mais de 100 anos 

3. O número de números de telefone discados incorretamente em um dia 

4. O número de pacotes de biscoitos caninos vendidos em uma determinada 
loja em um dia 

5. O número de clientes que entram em uma agência dos correios em um dia 

6. O número de vacâncias que ocorrem durante um ano no sistema judicial 
federal 

7 O número de partículas a descarregadas por um material radioativo em um 
período de tempo fixo 


Cada uma das variáveis aleatórias acima, e inúmeras outras, são aproxima- 
das pela distribuição de Poisson pela mesma razão — isto é, por causa da apro- 
ximação de Poisson para a distribuição binomial. Por exemplo, podemos supor 
que exista uma pequena probabilidade p de que cada letra escrita em uma pá- 
gina contenha um erro de impressão. Com isso, o número de erros de impressão 
em uma página será aproximadamente uma distribuição de Poisson com À = np, 
onde n é o número de letras em uma página. Similarmente, podemos supor que 
cada pessoa em uma comunidade tenha alguma pequena probabilidade de atin- 
gir a idade de 100 anos. Também, pode-se pensar que cada pessoa que entra em 
uma loja tem uma pequena probabilidade de comprar um pacote de biscoitos 
caninos, e assim por diante. 


Exemplo 7a 


Suponha que o número de erros tipográficos em uma única página deste livro 
tenha uma distribuição de Poisson com À = À. Calcule a probabilidade de que 
exista pelo menos um erro nesta página. 


Solução Se X representa o número de erros nesta página, temos 


PX=1)=1-PjX=0=1-ec"=0393 a 


Exemplo 7b 


Suponha que a probabilidade de que um item produzido por certa máquina 
apresente defeito seja de 0,1. Determine a probabilidade de que uma amostra 
de 10 itens contenha no máximo 1 item defeituoso. 
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Solução A probabilidade desejada e( o Jonas + ( E Jonros) = 


0,7361, enquanto a aproximação de Poisson resultaeme '+e!=0,7358. 


Exemplo 7c 


Considere um experimento que consiste em contar o número de partículas « 
perdidas em um intervalo de 1 segundo por 1 grama de material radioativo. Se 
sabemos de experiências anteriores que, em média, 3,2 partículas como essa são 
perdidas, qual é uma boa aproximação para a probabilidade de que não mais 
que 2 partículas a apareçam? 


Solução Se pensarmos em um grama do material radioativo como sendo 
formado por um grande número n de átomos, cada um dos quais com proba- 
bilidade 3,2/n de se desintegrar e perder uma partícula « durante o segundo 
considerado, então vemos que, como uma boa aproximação, o número de partí- 
culas a perdidas será uma variável aleatória de Poisson com parâmetro À = 3,2. 
Portanto, a probabilidade desejada é 


32) 
PX=<27]=e?+32* + Sr - “Pid 


= (0,3799 ] 


Antes de calcular o valor esperado e a variância de uma variável aleatória 
de Poisson com parâmetro À, lembre-se de que esta variável aleatória é uma 
aproximação para a variável aleatória binomial com parâmetros n e p quando n 
é grande, p é pequeno e À = np. Como tal variável aleatória binomial tem valor 
esperado np = À e variância np(1 -p) = A(1-p) = À (já que p é pequeno), pa- 
rece-nos que tanto o valor esperado quanto a variância de uma variável aleató- 
ria de Poisson são iguais a esse parâmetro À. Verificamos agora esse resultado: 

Ee 
EX=2, i! 
So, eAxi—A 


Sr =)! 


— A? fazendo-se 
= GA poa 
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Assim, o valor esperado de uma variável aleatória de Poisson X é de fato igual 
a seu parâmetro À. Para determinar sua variância, primeiro calculamos E[X”]: 


i=1 
o p , 
= (j + 1)e AN fazendo-se 


RE a 
= J! J=1 


<A se NV A Sos 
j=0 


J! e J! 


A 


=MA + 1) 


onde obtém-se a igualdade final porque a primeira soma é o valor esperado 
de uma variável aleatória de Poisson com parâmetro À e o segundo termo é a 
soma das probabilidades dessa variável aleatória. Portanto, como mostramos 
que E[X] = À, obtemos 


Var(X) = E[X?] — (ELX)? 
=A 


Com isso, o valor esperado e a variância de uma variável aleatória de Pois- 
son são iguais ao seu parâmetro À. 

Mostramos que a distribuição de Poisson com parâmetro np é uma apro- 
ximação muito boa para a distribuição do número de sucessos em n tentativas 
independentes quando cada tentativa tem probabilidade de sucesso p desde 
que n seja grande e p pequeno. De fato, ela permanece uma boa aproximação 
mesmo quando as tentativas não são independentes, desde que a dependência 
seja fraca. Como exemplo, lembre-se do problema do pareamento (Exemplo 
Sm do Capítulo 2),no qual n homens selecionavam seus chapéus aleatoriamen- 
te de um conjunto formado por um chapéu de cada pessoa. Do ponto de vista 
do número de homens que pode selecionar o seu próprio chapéu, podemos vi- 
sualizar a seleção aleatória como o resultado de n tentativas onde dizemos que 
a tentativa i é um sucesso se a pessoa i selecionar seu próprio chapéu, i = 1,..., 
n. Definindo-se os eventos E, i = 1,...,n, como 


E, = (a tentativa i é um sucesso] 


é fácil ver que 


1 1 Ee 
PE) = ” e P(EIIE,) El Ta Ji 


Assim, vemos que, embora os eventos E, i = 1,...,n, não sejam independen- 
tes, sua dependência, para n grande, parece ser fraca. Por causa disso, parece 
razoável esperar que o número de sucessos tenha aproximadamente uma dis- 
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tribuição de Poisson com parâmetro n X 1/n = 1,e de fato isso é verificado no 
Exemplo 5m do Capítulo 2. 

Para uma segunda ilustração da força da aproximação de Poisson quando 
as tentativas são fracamente dependentes, vamos considerar novamente o pro- 
blema do aniversário apresentado no Exemplo 5i do Capítulo 2. Neste exem- 
plo, supomos que cada uma das n pessoas tenha a mesma probabilidade de ter 
nascido em qualquer um dos 365 dias do ano, e o problema é determinar a pro- 
babilidade de que, em um conjunto de n pessoas independentes, ninguém faça 
aniversário no mesmo dia. Um argumento combinatório foi usado para deter- 
minar essa probabilidade, que se mostrou ser menor que 0,5 quando n = 23. 

Podemos aproximar a probabilidade anterior utilizando a aproximação de 
Poisson da forma a seguir: imagine que tenhamos uma tentativa para cada um 
n 
2 


sucedida se as pessoas i e | fizerem aniversário no mesmo dia. Se E, representar 


dos pares de indivíduos i e j,i  j, e digamos que a tentativa i, | é bem- 


PR 5 n 
o evento em que a tentativa i, | é um sucesso, então, embora os 2 eventos 


Eplsi<j=n,não sejam independentes (veja o Exercício Teórico 4.21), sua 
dependência parece ser relativamente fraca (de fato, esses eventos são indepen- 
dentes por pares, em que quaisquer 2 dos eventos E, e E, são independentes 
— novamente, veja o Exercício Teórico 4.1 21). Como P(E,) = 1/365, é razoável 


supor que o número de sucessos tenha aproximadamente uma distribuição de 


Poisson com média ( 5) Jess = n(n — 1)/730. Portanto, 


P(2 pessoas não fazerem aniversário no mesmo dia] = P(Q sucessos) 


=n(n — 1) 
f exp 730 | 


Para determinar o menor inteiro n para o qual essa probabilidade é menor que 
3 observe que 


é equivalente a 


Calculando o logaritmo de ambos os lados, obtemos 


n(n-1) = 730log2 
= 505,997 


que leva à solução n = 23, em concordância com o resultado do Exemplo 5i do 
Capítulo 2. 

Suponha agora que queiramos a probabilidade de que, entre n pessoas, 3 
delas não façam aniversário no mesmo dia. Embora este seja agora um difícil 
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problema combinatório, é simples obter-lhe uma boa aproximação. Para come- 
n 
3 
ondel=i<j<kx<n,echamemos a tentativa i, ;, k de sucesso se as pessoas 
i,j e k fizerem aniversário no mesmo dia. Como antes, podemos concluir que o 
número de sucessos é aproximadamente uma variável aleatória de Poisson com 
parâmetro 


çar, imagine que tenhamos uma tentativa para cada uma das trincas i,j, k, 


2 
( á ) Ptli,j, k fazerem aniversário no mesmo dia) = ( N ) ( l ) 


3) 1365 
cn(n — Dn — 2) 
6X (3652 


Com isso, 


P(3 pessoas não fazerem aniversário no mesmo dia) = exp | 


-n(n — D(n — 2 
799350 | 


Essa probabilidade é menor do que 1 quando n é tal que 
n(n — D(n — 2) = 799350 log2 = 5540671 


o que é equivalente a n = 84. Assim, a probabilidade aproximada de que pelo 
menos 3 pessoas em um grupo de 84 ou mais pessoas façam aniversário no 
mesmo dia é maior que à. 

Para que os eventos que ocorrem tenham aproximadamente uma distribui- 
ção de Poisson, não é essencial que todos os eventos tenham a mesma probabi- 
lidade de ocorrência, mas apenas que todas essas probabilidades sejam peque- 


nas. À seguir temos o paradigma de Poisson. 


Paradigma de Poisson Considere n eventos, com p, correspondendo à 
probabilidade de ocorrência do evento i,i = 1,...,n. Se todas as probabilidades 
p; são “pequenas” e as tentativas são independentes ou pelo menos “fracamen- 
te dependentesentão os eventos que ocorrem têm aproximadamente uma dis- 
tribuição de Poisson com média 354 pi. 

Nosso próximo exemplo não somente faz uso do paradigma de Poisson, 
mas também ilustra a variedade das técnicas que estudamos até agora. 


Exemplo 7d Extensão da maior série 


Uma moeda é jogada n vezes. Supondo que as jogadas sejam independentes, 
com cada uma delas dando cara com probabilidade p, qual é a probabilidade de 
que ocorra uma série com k caras consecutivas? 


Solução Vamos primeiramente usar o paradigma de Poisson para calcular 
essa probabilidade de forma aproximada. Assim, se parai = 1,..,n-k+1, 
supusermos que H, represente o evento em quei,i + 1,...,i+ k-— 1 jogadas dão 
cara, então a probabilidade desejada é de que pelo menos um dos eventos H, 
ocorra. Como HH, é o evento em que, começando com a jogada i, todas as k jo- 
gadas seguintes dão cara, tem-se que P(H,) = p*. Assim, quando p* é pequeno, 
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podemos pensar que os eventos H, que ocorrem devem ter aproximadamente 
uma distribuição de Poisson. Entretanto, este não é o caso, porque, embora 
todos os eventos tenham probabilidades pequenas, algumas de suas depen- 
dências são grandes demais para a que distribuição de Poisson seja uma boa 
aproximação. Por exemplo, como a probabilidade condicional de que dê cara 
nas jogadas 2,..., k + 1 dado que as jogadas 1...., k também deem cara é igual à 
probabilidade de que a jogada k + 1 dê cara, tem-se que 


P(HJH,) =P 


que é muito maior que a probabilidade incondicional de H.. 

O truque que nos permite usar uma aproximação de Poisson neste pro- 
blema é notar que uma série de k caras consecutivas só ocorrerá se houver 
uma série como essa imediatamente sucedida por uma coroa ou se todas as 
k jogadas finais derem cara. Consequentemente, para i = 1,...,n — k, suponha 
que E, seja o evento em que todas as jogadas i....,i + k — 1 dão cara e que a jo- 
gada i + k dê coroa; também, suponha que E, ,,, Seja o evento em que todas 
as jogadas n— k + 1,...,n dão cara. Observe que 


PE)=pPa-p, isn-k 
P(En-ka1) = p* 


Assim, quando p* é pequeno, cada um dos eventos E, tem uma pequena proba- 
bilidade de ocorrer. Além disso, para i  j, se os eventos E, e E, se referirem a 
sequências não superpostas de jogadas, então P(EJE;) = P(E,); se eles se refe- 
rirem a sequências que se superpõem, então P(E|E;) = 0. Com isso, em ambos 
os casos, as probabilidades condicionais se aproximam das probabilidades in- 
condicionais, o que indica que N, o número de eventos E, que ocorrem, deve ser 
aproximadamente uma distribuição de Poisson com média 


n-k+1 
EW]= 5 PE)=(n — opta — p) + pf 
i=1 
Como uma série de k caras não ocorre se (e somente se) N = 0, então a equa- 
ção anterior fornece 


P(não ocorrerem séries de caras com extensão k) = P(N = 0) = exp[—(n — k) 
k k 
pQ-p)-p) 

Se L, representar o maior número de caras consecutivas nas n jogadas, então, 


como L, será menor do que k se (e somente se) não ocorrerem séries de caras 
com extensão k, a equação anterior pode ser escrita como 


PL, <k)=expt-(n-Wp“ -p) — p9) 


Vamos agora supor que a moeda que jogamos seja honesta; isto é, suponha que 
p = 1/2. Então o desenvolvimento anterior leva a 


n—-k+2 n 
P(Ln < k) a ep(-*ao | as exp [=] 
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+ 
onde a aproximação final supõe que e2+! = 1 (isto é, que E = 0). Considere j 
= log, n e suponha que j é um inteiro. Para k = | + i, 
non 1 
+ 22H1 2H1 
Consequentemente, 
PlLn <j + im expt-(1/200!) 


o que implica 
PlLa=j+i)j=PMLan<j+i+l Pla <j+i 


exp(-(1/2)"2) — exp(-(1/2)+1) 


R 


Por exemplo, 
PL, <j-3) xe! a 0,0183 
PlLi=j-3)=ze? —-e!x= 01170 
PLln=j-29J=e!l - e? 02325 
PlLn=j-1)zel?2 - elx 02387 
PLn=)jselt — elx 01723 
PlLn=j+1)m=e 8 — el! a 0,1037 
PlLn=j+2)=eM6 — 8 = 0,0569 
PLn=j+3)=e 32 — el6 x 0,0298 
PlLnzj+4=1-e!/2 x 0,0308 


Q 


Assim, observando o fato bastante interessante de que não importa quão gran- 
de seja n, a extensão da série mais longa de caras em uma sequência de n joga- 
das de uma moeda honesta estará a uma distância de 2 de log,(n) — 1 com uma 
probabilidade igual a 0,86. 

Deduzimos agora uma expressão exata para a probabilidade de ocorrência 
de uma série de k caras consecutivas quando uma moeda que tem probabilida- 
de p de dar cara é jogada n vezes. Com os eventos E, definidos como antes, com 
i=1,.,n-k+ 1,e L, representando, também como antes, o comprimento da 
série mais longa de caras, 


P(L, = k) = P(haver uma série de k caras consecutivas) = PUC E) 
A identidade de inclusão-exclusão para a probabilidade de uma união pode ser 


escrita como 
n-k+1 
PU PED= 5 (DS RE E) 
t=1 <<ir 


Vamos supor que S, represente o conjunto de números de jogadas às quais o 
evento E, se refere (então, por exemplo, S, = [1,...,k + 1)). Agora, considere 
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uma das r probabilidades de interseção que não incluem o evento E, ,,,- Isto 
é, considere P(E;,--, Ei,), onde i, <-.-<i,<n—k + 1. Por um lado, se houver 
qualquer superposição nos conjuntos S;,,...,S;, então essa probabilidade é igual 
a 0. Por outro lado, se não houver superposição, os eventos E;,,..., Ei, são inde- 
pendentes. Portanto 


se houver qualquer superposição em S$;,,...,5; 
se não houver superposição 


r 


0, 
PE Ei)= a —- py 


Devemos agora determinar o número de escolhas diferentes dei, <--.<i, <n-k 
+ 1 para as quais não existe superposição nos conjuntos S;,..., $;. Para fazer isso, 
note primeiro que cada um dos conjuntos $;,j = 1....,r,se refere a k + 1 jogadas, 
então, sem qualquer superposição, eles se referem conjuntamente a r(k + 1) joga- 
das. Considere agora quo permutação de r letras a idênticas (uma para cada 
um dos conjuntos $j;,..., $i; 1) e den —r(k + 1) letras b idênticas ea para cada 
uma das tentativas que não faz parte de qualquer um dos $;,,..., $; » Sn-k+1 con- 
juntos). Interprete o número de b's antes da primeira letra a como sendo o núme- 
ro de jogadas antes de S$;, o número de bºs antes da primeira e da segunda letra a 
como o número de jogadas entre S; e Sips e assim por diante, com o número de b's 
após a última letra a representando o número de jogadas após S, . Como existem 
Ro | permutações de r letras a e de n — r(k + 1) letras b, com cada permutação 
como essa correspondendo (em uma relação um para um) a uma diferente esco- 
lha sem superposição, tem-se que 


— rk 
Do PE E)= (" E ra -pY 


n<<ip<n—k+ 


Devemos agora considerar as probabilidades de interseção de r maneiras da 
forma 


PE; Ei, Eni), 


onde i, <---<i ,<n-k + 1. Agora, essa probabilidade será igual a O se hou- 
ver qualquer superposição em Sj,..., $i,  Sn-k; Se não houver superposição, 
então os eventos da interseção serão independentes. Assim, 


PE; Ei Ena) = pa - pJript=p"a —- py 


Usando um argumento similar, o número de conjuntos $;,,..., $;, , Sn-k que não 
se superpõem será igual ao número de permutações de r — 1 letras a (uma para 
cada um dos conjuntos 8;,...,$;, )eden-(r-D)(k+1)-k=n-rk-(r-1) 
letras b (uma para cada uma das tentativas que não é parte de qualquer um dos 
conjuntos $;,..., 5; | Sn-k+1). Como existem di permutações de r— 1 letras a 
eden-rk-(r-1) letras b, temos 


n— rk 
> Pg EBom)s= f á era a 


: 1 
y<..<i q<n-k+ 
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Colocando tudo junto, obtemos a expressão exata, isto é, 


pat n— rk 1/n— rk 
Pln=kh= 5 ct [( à ) + (1 E )Jera Ed 
r=1 


p 


onde utilizamos a convenção de que (1) =0Osem<j. 

Do ponto de vista computacional, um método mais eficiente para o cálculo da 
probabilidade desejada do que o uso da última identidade envolve a dedução de 
um conjunto de equações recursivas. Para fazer isso, suponha que 4, seja o evento 
em que há um conjunto de k caras consecutivas em uma sequência de n jogadas 
de uma moeda honesta, e considere P, = P(A,). Vamos deduzir um conjunto de 
equações recursivas para P, colocando uma condição no aparecimento da pri- 
meira coroa. Para j = 1,..., k, suponha que F, seja o evento em que a primeira cara 
aparece na jogada j, e suponha que H seja o evento em que todas as primeiras 
k jogadas dão cara. Como os eventos F,,..., F,, H são mutuamente exclusivos e 
exaustivos (isto é, exatamente um desses eventos deve ocorrer), temos 

k 
P(An) = > P(AnlFDP(E) + P(AnIH)PUD) 
j=1 


Agora, dado que a primeira coroa aparece na jogada j, onde j < k, tem-se que 
estas | jogadas são perdidas no que se refere à obtenção de uma série de k caras 
em sequência; assim, a probabilidade condicional deste evento é a probabilida- 
de de que tal série ocorra entre as n — ; jogadas restantes. Portanto 


P(A,IE) = P.; 


Como P(A,|H) = 1,a equação anterior resulta em 


P, = P(An) 
k 
=> Pr; PF) + PH) 
j=l 
k . 
=5 Paypla — p) + p* 
j=1 


Começando com P, = 0,;<k,e P, = id podemos usar a última fórmula para 
computar recursivamente P, ,,, P,.,2,e assim por diante, até P,. Por exemplo, su- 
ponha que queiramos determinar a probabilidade de ocorrência de uma série 
de 2 caras consecutivas quando uma moeda honesta é jogada 4 vezes. Então, 
com k = 2, temos P, = 0, P, = (1/2). Já que, quando p = 1/2, a fórmula recur- 
siva se torna 
k 
Pr=,Prj(1/2) + (1/2 
j=1 


obtemos 
P, = P(1/2) + P(1/2) + (1/2) = 3/8 
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P, = P(1/2) + P(1/2) + (112) = 1/2 


o que é claramente verdade porque existem 8 resultados que levam a uma série 
de 2 caras consecutivas: Ahhh, hhht, hhth, hthh, thhh, hhtt, thht e tthh (sendo h 
cara e t coroa). Cada um desses resultados ocorre com probabilidade 1/16. E 


Outro uso da distribuição de probabilidades de Poisson aparece em situa- 
ções em que “eventos” ocorrem em certos instantes de tempo. Um exemplo é 
a consideração de um terremoto como um evento; outro possível evento é a 
entrada de pessoas em determinado estabelecimento (bancos, agências de cor- 
reio, postos de gasolina, e assim por diante), e uma terceira possibilidade seria a 
de chamar de evento o início de uma guerra. Vamos supor que eventos estejam 
de fato ocorrendo em certos instantes (aleatórios) de tempo, e que, para algu- 
ma constante positiva À, as seguintes hipóteses sejam verdadeiras: 


1. A probabilidade de que exatamente 1 evento ocorra em um dado intervalo 
com extensão h é igual a Ah + o(h), onde o(h) representa qualquer função 
f(h) para a qual im, fh)lh = 0 [por exemplo, f(h) = hº é o(h), enquanto 
que f(h) = A não é). 

2. A probabilidade de que 2 ou mais eventos ocorram em um intervalo de 
extensão h é igual a o(A). 

3. Para quaisquer inteiros n,,,),»...,), € quaisquer conjuntos de intervalos que 
não se superpõem, se definirmos E, como o evento em que exatamente ;, 
dos eventos em consideração ocorrem no i-ésimo desses intervalos, então 
os eventos E,, E,,..., E, são independentes. 


Analisando informalmente, as hipóteses 1 e 2 dizem que, para valores pe- 
quenos de h, a probabilidade de que exatamente 1 evento ocorra em um inter- 
valo de extensão h é igual a Ah mais algo que é pequeno em comparação com 
h, enquanto que a probabilidade de que 2 ou mais eventos ocorram é pequena 
em comparação com A. A hipótese 3 diz que algo que ocorre em certo intervalo 
não tem efeito (em termos de probabilidade) nos demais intervalos não super- 
postos a este. 

Agora mostramos que, de acordo com as hipóteses 1,2 e 3,0 número de 
eventos que ocorrem em qualquer intervalo de extensão t é uma variável alea- 
tória de Poisson com parâmetro At. Para sermos precisos, consideremos o inter- 
valo [0, t] e representemos o número de eventos que ocorrem neste intervalo 
por N(t). Para obter uma expressão para P(N(t) = k), começamos quebrando o 
intervalo em pequenos intervalos não superpostos, cada um com tamanho t/n 
(Figura 4.7). 


= 2% 3 t= 
a (n-1)4 2a 


Figura 4.7 
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Agora, 
P(N(t) = k) = Plk dos n subintervalos contenham exatamente 1 evento 


e os outros n — k subintervalos contenham 0 eventos) (72) 
+ PIN(t) = k e pelo menos 1 subintervalo 


contenha 2 ou mais eventos) 


A equação anterior é verdadeira porque o evento representado no lado esquer- 
do, isto é, [N(t) = k), é claramente igual à união dos dois eventos mutuamente 
exclusivos no lado direito da equação. Supondo que 4 e B representem os dois 
eventos mutuamente exclusivos no lado direito da Equação (72), temos 

P(B) = Pfpelo menos um subintervalo contenha 2 ou mais eventos) 


n 
=P (Uti-ésimo subintervalo contenha 2 ou mais eventos) 
i=1 
n 
= o Pfi-ésimo subintervalo contenha 2 ou mais eventos) 


i=1 
= > o (1) pela hipótese 2 
i=1 
(1) 
=no | — 
n 
o (E) 
E t/n 


Além disso, para cada +, t/n > 0 se n > º; assim, pela definição de o(h), o(tn)/ 
(tn)> 0 se n5 o. Com isso, 


pela desigualdade 
de Boole 


P(B)50 se n50 (73) 
Além do mais, como as hipóteses 1 e 2 implicam que” 


P(0 eventos ocorram em um intervalo A) 
=1-[Ah+o(h)+o(h)]=1-Ah-o(h) 


vemos da hipótese de independência (número 3) que 


P(A) = Pfk dos subintervalos contenham exatamente 1 evento e os demais 
n — k intervalos contenham O eventos) 


(9) e o(D] [= (8) (9 


* A soma de duas funções, ambas do tipo o(A), também é o(h). Isto ocorre porque se 
Bim, o fU)h = lim, o g(h)/h = 0, então lim, ,olH(h) + g(h)Yh = 0. 
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Entretanto, como 


At t t 
n Ê + o (5)| =At+ (| >At se n->00 
n n t/n 
tem-se, pelo mesmo argumento que verificou a aproximação de Poisson para a 
distribuição binomial, que 
An 
P(A)-se no se n-00 (74) 


Assim, das Equações (72), (73) e (74), e fazendo nº, obtemos 


a (ADE 


PINO =kj=e 7 


k=0,1,... (75) 

Com isso, se as hipóteses 1,2 e 3 são satisfeitas, então o número de eventos 
que ocorrem em qualquer intervalo fixo t é uma variável aleatória de Poisson 
com média At, e dizemos que os eventos ocorrem em concordância com um 
processo de Poisson com taxa À. O valor À, o qual se pode mostrar como sendo 
igual à taxa por unidade de tempo na qual os eventos ocorrem, é uma constante 
que precisa ser determinada empiricamente. 

A discussão anterior explica por que uma variável aleatória de Poisson é usu- 
almente uma boa aproximação para fenômenos tão diversos quanto os seguintes: 


1. O número de terremotos que ocorrem durante um intervalo de tempo fixo 

2. O número de guerras por ano 

3. O número de elétrons emitidos por um catodo aquecido durante um inter- 
valo de tempo fixo 

4. O número de mortes, em dado período de tempo, de segurados de uma 
companhia que vende seguros de vida 


Exemplo 7e 

Suponha que terremotos ocorram na região oeste dos EUA de acordo com as 
hipóteses 1,2 e 3, com À = 2 e tendo como unidade de tempo o intervalo de 1 
semana (isto é, terremotos ocorrem de acordo com as três hipóteses em uma 
taxa de 2 por semana). 


(a) Determine a probabilidade de que pelo menos 3 terremotos ocorram du- 
rante as próximas 2 semanas. 

(b) Determine a distribuição de probabilidade do tempo, começando de ago- 
ra, até a ocorrência do próximo terremoto. 


Solução (a) Da Equação (75), temos 
PNQ) =3)=1- PIN()=0) - PINQ=1) - PINO =2) 
2 
Este Rep o Ses 
=1 — 13 
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(b) Suponha que X represente a quantidade de tempo (em semanas) 
até que ocorra o próximo terremoto. Como X será maior que t se 
e somente se nenhum evento ocorrer nas próximas í unidades de 
tempo, temos, da Equação (75), 


PX> 9 =PIN(=0|=e” 


então a função distribuição de probabilidade F da variável alea- 
tória X é dada por 


Fy)=PX=<)=1I-PX>g]=1-e" 
=1-e* E 


4.7.1 Calculando a função distribuição de Poisson 
Se X é uma variável aleatória de Poisson com parâmetro À, então 
PX=i+1) eNHAD! A 
PX=i) e-ANifi! “i+l 


(76) 


Começando com P(X = 0) = e”, podemos usar a Equação (7.6) para fazer 
cálculos sucessivos 


P(X=)=AP(X=0) 
PX=2)= PUX =1) 


: À l 
RE io q E 


A página deste livro na Internet inclui um programa que usa a Equação 
(76) para calcular probabilidades de Poisson. 


Exemplo 7f 


(a) Determine P[X = 90) quando X é uma variável aleatória de Poisson com 
média 100. 


(b) Determine P(X = 1075] quando Y é uma variável aleatória de Poisson 
com média 1000. 


Solução A partir da página deste livro na Internet, obtemos as soluções: 


(a) P(X = 90) = 0,1714 
(b) P[Y = 1075) = 0,9894 E 
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4.8 OUTRAS DISTRIBUIÇÕES DE PROBABILIDADE DISCRETAS 


4.8.1 A variável aleatória geométrica 


Suponha que tentativas independentes, cada uma delas com probabilidade de 
sucesso p, O < p < 1, sejam realizadas até que ocorra um sucesso. Seja X o nú- 
mero de tentativas necessárias. Então 


PX=-mn=(1=pp n=12 (8.1) 


Obtemos a Equação (8.1) porque, para que X seja igual a n, é necessário e 
suficiente que as primeiras n — 1 tentativas sejam fracassos e que a n-ésima 
tentativa seja um sucesso. Tem-se portanto a Equação (8.1), já que se supõe a 
independência dos resultados das tentativas sucessivas. 

Como 


[6.0] ' = oo E rs p o 
2 Ressaca” 


tem-se que, com probabilidade 1, um sucesso acabará ocorrendo. Qualquer va- 
riável aleatória X cuja função de probabilidade seja dada pela Equação (8.1) é 
chamada de variável aleatória geométrica com parâmetro p. 


Exemplo 8a 


Uma urna contém N bolas brancas e M bolas pretas. A bolas são selecionadas 
aleatoriamente, uma de cada vez, até que saia uma bola preta. Se supormos que 
cada bola selecionada seja substituída antes que a próxima bola seja retirada, 
qual é a probabilidade de que 


(a) sejam necessárias exatamente n retiradas? 
(b) sejam necessárias pelo menos k retiradas? 


Solução Se X representar o número de retiradas necessárias até que se sele- 
cione uma bola preta, então X satisfaz a Equação (8.1) com p = MM + N). 


Portanto, 

li No Ni o M MNA 
Px=m=(552) M+N (M+4 Ny 

(b) 


M —- 
ad ren aa) 


de e 7] 


(ma) 
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Naturalmente, a letra (b) poderia ter sido obtida diretamente, pois a probabili- 
dade de que sejam necessárias pelo menos k tentativas para que se obtenha um 
sucesso é igual à probabilidade de que só ocorram fracassos nas primeiras k — 1 
tentativas. Isto é, para uma variável aleatória geométrica, 


PX=kj=0-pS z 


Exemplo 8b 


Determine o valor esperado de uma variável aleatória geométrica. 


Solução Comq =1-p,temos 
oo 
EX] = 5 ig"!p 
i=1 
oo 
=5G-1+Dg"!p 
i=1 


oo 0.0] 
=) 6-Dg'!p + 54p 
i=1 


i=1 


Oo: . 
=>jgp +1 
j=0 
eo . 
=9> jp +1 
j=1 
=qEX] +1 
Portanto, 
pEX|=1 
o que resulta em 
1 
E[X] = — 
p 


Em outras palavras, se tentativas independentes com mesma probabilidade p 
de sucesso são realizadas até que o primeiro sucesso ocorra, então o número es- 
perado de tentativas necessárias é igual a 1/p. Por exemplo, o número esperado 
de jogadas necessárias para que saia 1 em um dado honesto é igual a 6. E 


Exemplo 8c 
Determine a variância de uma variável aleatória geométrica. 
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Solução Para determinar Var(X), vamos primeiro calcular E[X”]. Com g = 1-p, 
temos 


oo 
Ep] =) ,29"!p 
i=1 
So . 
=50-1+ gp 
i=1 


oo o oo 
=50-Dgp + 520 -Dg!p + 5.qº!p 
i=i 


i=1 i=1 
So . ad da 
=> Pap +2>,jap +1 
j=0 j=1 
=qE(X?] + 29E(X] + 1 
Usando E[X] = 1/p, a equação para E[X”] resulta em 


2 
PELO] = E +1 


Portanto, 


o que dá o resultado 
+1 1 1- 
Var(X) = É 7) E S= + 
Pp Pp 4 4 E 


4.8.2 A variável aleatória binomial negativa 
Suponha que tentativas independentes com mesma probabilidade de sucesso p, 
O <p < 1,sejam realizadas até que se acumule um total de r sucessos. Se X for 

igual ao número de tentativas necessárias, então 

n-—1 r n-r 
Px=m=(121)ra-» n=rr+1,... (8.2) 


A Equação (8.2) é obtida porque, para que o r-ésimo sucesso ocorra na n-ésima 
tentativa, devem ocorrer r— 1 sucessos nas primeiras n — 1 tentativas e a n-ésima 
tentativa deve ser um sucesso. A probabilidade do primeiro evento é 


É T ea = py” 
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e a probabilidade do segundo evento é p; assim, pela independência, estabele- 
ce-se a Equação (8.2). Para verificar que no final um total de r sucessos acaba 
sendo acumulado, ou provamos analiticamente que 


> Px =n OB E ra ssa (8.3) 


n=r n=r 


ou damos o argumento probabilístico a seguir: o número de tentativas necessá- 
rias para que se obtenham r sucessos pode ser representado como Y, + Y, +... 
+ Y, onde Y, é o número de tentativas necessárias para O primeiro sucesso, Y, 
é o número de tentativas adicionais feitas até que ocorra o segundo sucesso, Y, 
é o número de tentativas adicionais até que ocorra o terceiro sucesso e assim 
por diante. Tem-se que Y,, Y,...., Y, são todas variáveis aleatórias geométricas. 
r 
Portanto, cada uma delas é finita com probabilidade 1, e então 3' Y; também 
i=1 
deve ser finita, o que estabelece a Equação (8.3). 

Qualquer variável aleatória X cuja função de probabilidade seja dada pela 
Equação (8.2) é chamada de variável aleatória binomial negativa com parâme- 
tros (r,p). Observe que uma variável aleatória geométrica é simplesmente uma 
variável binomial negativa com parâmetros (1, p). 

No próximo exemplo, usamos uma variável aleatória binomial negativa 
para obter uma solução para o problema dos pontos. 


Exemplo 8d 


Se tentativas independentes, cada uma delas resultando em um sucesso com 
probabilidade p, são realizadas, qual é a probabilidade de que r sucessos ocor- 
ram antes de m fracassos? 


Solução A solução é obtida notando-se que ocorrem r sucessos antes de m 
fracassos se e somente se o r-ésimo sucesso ocorrer até a (r + m —1)-ésima 
tentativa. Tem-se esse resultado porque, se o r-ésimo sucesso tiver ocorrido 
antes da ou na (r + m — 1)-ésima tentativa, então ele deve ter ocorrido antes 
do m-ésimo fracasso, e vice-versa. Portanto, da Equação (8.2), a probabilidade 
desejada é 


rtm—1 ni sei 
A (Do i)ra pre 


n=r 


Exemplo 8e O problema de pareamento de Banach 


Um matemático que fuma cachimbos sempre carrega consigo duas caixas de 
fósforos — uma no seu bolso esquerdo e a outra no seu bolso direito. Cada vez 
que precisa de um fósforo, ele o retira de um bolso ou de outro com mesma 
probabilidade. Considere o momento em que o matemático descobre que uma 
de suas caixas de fósforo está vazia. Se se supõe que ambas as caixas de fósforos 
continham inicialmente N fósforos, qual é a probabilidade de que existam exa- 
tamente X fósforos, k = 0,1.,..., N, na outra caixa? 


Capítulo 4 + Variáveis Aleatórias 199 


Solução Seja E o evento em que o matemático descobre que a caixa de fós- 
foros do bolso direito está vazia e que existem K fósforos na caixa do bolso 
esquerdo naquele exato momento. Agora, este evento ocorrerá se e somente 
se a (N + 1)-ésima escolha da caixa do bolso direito for feita na (N + 1 + N- 
k)-ésima tentativa. Portanto, da Equação (8.2) (com p = 1/2,r= N + 1,en = 
2N-k + 1), vemos que 


= 1 2N-k41 
ro=(25 (9 


Como há uma mesma probabilidade de que a caixa em seu bolso esquerdo se 
esvazie primeiro e que existam k fósforos na caixa em seu bolso direito neste 
exato momento, o resultado desejado é 


2N - k jo 

2P(E) = = 

n=(Ly Da . 
Exemplo 8f 


Calcule o valor esperado e a variância de uma variável aleatória binomial ne- 
gativa com parâmetros r e p. 


Solução Temos 
E n-1 
EX = 5 nº ( Ea )ra - pr 
n=r 


(0,0) 
ER a (Na pr iá n-19) í(n 
rr (1)p (1 — p) já que ela jet) 


po 8 PRE fazendo-se 
= 5 a (m = 184 ( ' Jpé (a o pr m=n + 1 
m=r41 


r — 
=-EIMW — 91] 
p 
onde Y é uma variável aleatória binomial negativa com parâmetros r + 1,p. 
Fazendo k = 1 na equação anterior, obtemos 
r 
E[X] = — 
p 
Fazendo k = 2 na equação de E[X* e usando a fórmula para o valor esperado 
de uma variável aleatória binomial negativa, obtemos 


EV] = EI — 1] 


FE) 
p Pp 
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Portanto, 


p? ] 


Assim, do Exemplo 8f, se tentativas independentes, cada uma das quais com 
probabilidade de sucesso p, são realizadas, então o valor esperado e a variância 
do número de tentativas necessárias para que r sucessos sejam acumulados são 
rip e r(1 - p)/p”, respectivamente. 

Como uma variável aleatória geométrica é tão somente uma variável alea- 
tória binomial negativa com parâmetro 7 = 1, vemos do exemplo anterior que 
a variância de uma variável aleatória geométrica com parâmetro p é igual a 
(1- p)/p”,o que concorda com o resultado do Exemplo 8c. 


Exemplo 8g 


Determine o valor esperado e a variância do número de vezes que alguém deve 
lançar um dado até dar 1 quatro vezes. 


Solução Como a variável aleatória de interesse é uma variável aleatória bino- 
mial negativa com parâmetros r = 4e p = a tem-se que 


EX] =24 


4.8.3 A variável aleatória hipergeométrica 


Suponha que uma amostra de tamanho n seja escolhida aleatoriamente (sem 
devolução) de uma urna contendo N bolas, das quais m são brancas e N —-m são 
pretas. Se X representa o número de bolas brancas selecionadas, então 


E) 
i n-—i 
P(X =)= i=0,1,. 


Uma variável aleatória X cuja função de probabilidade é dada pela Equação (8.4) 
para alguns valores de n, N e m é chamada de variável aleatória Aipergeométrica. 


RR ,) (8.4) 


Observação: Embora tenhamos escrito a função de probabilidade hiper- 
geométrica com i variando de 0 an, P(X = i) será na realidade igual a O a menos 
que i satisfaça as desigualdades n —- (N -m) <= i = min(n,m). Entretanto, a Egua- 
Fr 


l =0Osek<Oou 
r<k. | 


ção (8.4) é sempre válida graças à nossa convenção de que 
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Exemplo 8h 


Um número desconhecido, digamos N, de animais habita certa região. Para 
obter alguma informação sobre o tamanho da população, ecologistas realizam 
com frequência o seguinte experimento: primeiro, eles capturam um número, 
digamos, m, desses animais, marcam-nos de alguma maneira e os soltam. Após 
dar aos animais marcados tempo suficiente para se dispersarem na região, uma 
nova captura de n animais é feita. Seja X o número de animais marcados pegos 
nesta segunda captura. Se supormos que a população de animais na região não 
tenha mudado no intervalo de tempo entre as duas capturas e que cada animal 
tenha a mesma probabilidade de ser capturado, então X é uma variável aleató- 
ria hipergeométrica tal que 


À n-i 
P(X=)= = P(N) 


Suponha agora que se tenha observado que X é igual a i. Então, como P(N) 
representa a probabilidade do evento observado quando há na realidade N ani- 
mais presentes na região, parece que uma estimativa razoável de N seria o valor 
dessa variável que maximiza P(N). Tal estimativa é chamada de estimativa de 
máxima verossimilhança (veja os Exercícios Teóricos 4.13 e 4.18 para outros 
exemplos deste tipo de procedimento de estimação). 

A maximização de P(N) pode ser feita muito facilmente primeiro notan- 
do-se que 


PIN) (N>-m(N-—n 
PN-D NNom-n+i 


Agora, a razão anterior é maior que 1 se e somente se 
(N-m(N=-n=N(N-m-n+i) 
ou, equivalentemente, se e somente se 


N=< ET 
l 
Assim, P(N) primeiro aumenta e depois diminui, atingindo um máximo no 
maior número inteiro menor que mn/i. Esse valor é a estimativa de máxima 
verossimilhança de N. Por exemplo, suponha que a captura inicial consista em 
m = 50 animais, que são marcados e então soltos. Se uma captura subsequente 
consiste em n = 40 animais dos quais i = 4 são marcados, então estimaríamos 
a existência de aproximadamente 500 animais na região (note que a estima- 
tiva anterior poderia ter sido obtida se considerássemos que a proporção de 
animais marcados na região, m/N, é aproximadamente igual à proporção de 
animais marcados em nossa segunda captura, i/n). H 
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Exemplo 8i 

Um comprador de componentes elétricos os compra em lotes de 10. É sua po- 
lítica inspecionar 3 componentes de um lote aleatoriamente e aceitar o lote se 
todos os 3 itens inspecionados não apresentarem defeito. Se 30% dos lotes têm 
4 componentes defeituosos e 70% têm apenas 1 componente defeituoso, que 
proporção de lotes é rejeitada pelo comprador? 


Solução Seja À o evento em que o comprador aceita o lote. Então, 


P(A) = P(Allote tenha quatro itens com defeito) + P(Allote tenha 1 item com defeito) E 


e 


54 
“100 
Portanto, 46% dos lotes são rejeitados. mn 


Se n bolas são escolhidas aleatoriamente e sem devolução de um conjun- 
to de N bolas das quais a fração p = m/N é branca, então o número de bolas 
brancas selecionadas é uma variável aleatória hipergeométrica. Parece agora 
que, quando m e N são grandes em relação a n, não importa muito se a seleção 
é feita com ou sem devolução, porque, independentemente de quantas bolas 
tenham sido selecionadas anteriormente, quando m e N são grandes, cada sele- 
ção adicional terá probabilidade aproximadamente igual a p de ser branca. Em 
outras palavras, parece intuitivo que quando m e N são grandes em relação a n,a 
função de probabilidade de X deva se aproximar da função de probabilidade de 
uma variável aleatória binomial com parâmetros n e p. Para verificar essa intui- 
ção, note que se X é uma variável aleatória hipergeométrica, então, para i = n, 


agp) 


m! (N-—- mm! (N — nn! 
“mm )N-m=-n+ Dn - id! N! 
nymm-—1 m-]i+1IN>->mN>-m-l 
(SNI CNI NE Neue 
N>-m>-(hn-—i-—1) 
CN=tat El 
. ; quando p = m/N,me N são 
ES — pr grandes em relação an ei 


2 


[4 
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Exemplo 8j 


Determine o valor esperado e a variância de X, uma variável aleatória hiper- 
geométrica com parâmetros n, N em. 


Solução 


EXMy=5 PPX=i) 


SADC /0) 


Usando as identidades 


obtemos 


asse DC 0) 


eta k-1 
é EM + DS! 


onde Y é uma variável aleatória hipergeométrica com parâmetros n - 1,N —1 e 
m — 1. Com isso, fazendo k = 1, temos 


EIX]= 


Colocando em palavras, se n bolas são selecionadas aleatoriamente de um con- 
junto de N bolas, das quais m são brancas, então o número esperado de bolas 
brancas selecionadas é igual a nm/N. 

Fazendo k = 2 na equação para E[X“], obtemos 


EX] = a ELY 2] 


com (n — Dm — 1) 
=| N-1 +] 


onde a última igualdade usa o resultado que obtemos para o cálculo do valor 
esperado da variável aleatória hipergeométrica Y. 
Como E[X] = nm/N, podemos concluir que 


nm [É — D(m — 1) EE | 


VardO) = 
Ri RO aa NE N 
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Fazendo p = m/N e usando a identidade 
m-—1l Np-1. 1-p 
NES ANDES Ap 


obtemos 
1- 
Var) =npltr — Dp- (n- DE +1- np] 
—1 
=np( PDA - E 


Observação: Mostramos no Exemplo 8j que se n bolas são selecionadas 
aleatoriamente e sem devolução de um conjunto de N bolas, das quais a fração 
p é branca, então o número esperado de bolas brancas escolhidas é np. Além 
disso, se N é grande em relação a n [de forma que (N — n)/(N — 1) seja aproxi- 
madamente igual a 1], então 


Var(X) = np(1 —p) 


Em outras palavras, E[X] é o mesmo quando a seleção das bolas é feita com 
devolução (de forma que o número de bolas brancas seja binomial com parâ- 
metros n e p); e se o conjunto total de bolas for grande, então Var(X) é aproxi- 
madamente igual ao valor que teria caso a seleção fosse feita sem devolução. 
Graças ao nosso resultado anterior que diz que quando o número de bolas em 
uma urna é grande, o número de bolas escolhidas tem aproximadamente a fun- 
ção de probabilidade de uma variável aleatória binomial, o resultado obtido é 
exatamente o que teríamos imaginado. E 


4.8.4 A distribuição zeta (ou Zipf) 


Uma variável aleatória tem uma distribuição zeta (às vezes cnamada de Zipf) 
se sua função de probabilidade é dada por 


PX=H = k=1,2,... 


para algum valor de a > 0. Como a soma das probabilidades anteriores deve 
ser igual a 1, tem-se que 


A distribuição zeta deve seu nome ao fato da função 


Si Nº 1º (; » 
C(s) = + (5) + (5) ++ :) + 


ser conhecida em disciplinas da matemática como a função zeta de Riemann 
(em homenagem ao matemático alemão G. F. B. Riemann). 
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A distribuição zeta foi usada pelo economista italiano V. Pareto para des- 
crever a distribuição dos rendimentos das famílias de um dado país. Entretanto, 
foi G.K. Zipf quem aplicou a distribuição zeta em uma ampla variedade de 
problemas em diferentes áreas e, ao fazer isso, popularizou o seu uso. 


4.9 VALOR ESPERADO DE SOMAS DE VARIÁVEIS ALEATÓRIAS 


Uma propriedade muito importante das esperanças é a de que o valor espe- 
rado de uma soma de variáveis aleatórias é igual à soma de suas esperanças. 
Nesta seção, vamos demonstrar esse resultado supondo que o conjunto de valo- 
res possíveis do experimento probabilístico — isto é, o espaço amostral S — seja 
finito ou contavelmente infinito. Embora o resultado seja verdadeiro indepen- 
dentemente dessa hipótese (e uma demonstração é esboçada nos exercícios 
teóricos), essa hipótese não somente simplifica o argumento mas também re- 
sulta em uma prova esclarecedora que agregará conhecimento à intuição que 
temos sobre as esperanças. Assim, no restante desta seção, suponha que o espa- 
ço amostral S seja um conjunto finito ou contavelmente infinito. 

Para uma variável aleatória X, suponha que X(s) represente o valor de X 
quando s E S é o resultado do experimento. Agora, se X e Y são ambas variá- 
veis aleatórias, então sua soma também o é. Isto é,Z = X + Y também é uma 
variável aleatória. Além disso, Z(s) = X(s) + Y(s). 


Exemplo 9a 


Suponha que o experimento consista em jogar uma moeda 5 vezes, sendo o 
resultado a sequência obtida de caras e coroas. Suponha que X seja o número 
de caras que saem nas primeiras 3 jogadas e Y o número de caras que saem nas 
2 últimas jogadas. Seja Z = X + Y. Então, por exemplo, para o resultado s = (A, 
t,h,t,h) onde A é cara e t é coroa, 


X(s)=2 
Y()=1 
Z)=X(s) + Y(9)=3 


o que significa que o resultado (A, t, h,t,h) resulta em 2 caras nas primeiras 
três jogadas, 1 cara nas últimas duas jogadas, e em um total de 3 caras nas 
cinco jogadas. E 


Seja p(s) = P([s)) a probabilidade de que s seja o resultado do experimen- 
to. Como podemos escrever qualquer evento A como a união finita ou conta- 
velmente infinita dos eventos mutuamente exclusivos (s),s E 4, tem-se pelos 
axiomas da probabilidade que 


P(A) = > p(s) 


sEA 
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Quando 4 = S,a última equação resulta em 


1=5 06) 


ses 


Agora, suponha que X seja uma variável aleatória e considere E[X]. Como X(s) é 
o valor de X quando s é o resultado do experimento, parece intuitivo que E[X] — 
a média ponderada dos valores possíveis de X, com cada valor sendo ponderado 
pela probabilidade de que X assuma aquele valor — deva ser igual à média pon- 
derada dos valores X(s),s E $, com X(s) sendo ponderado pela probabilidade de 
que s seja o resultado do experimento. Demonstramos agora essa intuição. 


Proposição 9.1 
El] => X(s)p(s) 


ses 


Demonstração Suponha que os valores distintos de X sejam x, i = 1. Para 
cada i, suponha que S, seja o evento em que X é igual a x,. Isto é, 5, = [s: X(s) 
= x). Então, 


ED]=> nP(X =x) 
E Do xP(S)) 


=5m5,p(9) 


i ses; 


=3D,xp(s) 


i seS; 

=5 >, X(p(s) 
i seS; 

=> X(sp(s) 


ses 


onde se obtém a igualdade final porque S,, S,,... são eventos mutuamente 
exclusivos cuja união é S. 0 


Exemplo 9b 


Suponha que duas jogadas independentes de uma moeda que dá cara com pro- 
babilidade p sejam feitas, e suponha que X represente o número obtido de ca- 
ras. Como 


PX=0=P(t)=(1-p)?, 
PXx=D=P(h,o)+Pth=2p(-p) 
PX=9=Phh=p? 


Capítulo 4 * Variáveis Aleatórias 207 


tem-se da definição do valor esperado que 
E]=0-(1-p/+1:2p(1-p)+2:p=2p 

o que concorda com 

EIX] = X(h, hp? + XGh,)pCl — D) + XGhA — pp + XE — pj? 


=2º +p1-D+(1-pp 
=2p E 


Demonstramos agora o útil e importante resultado de que o valor esperado de 
uma soma de variáveis aleatórias é igual à soma de suas esperanças. 


Corolário 9.2 Para as variáveis aleatórias X,, X,,..., X, 
n n 
E|3 x |=> ElXi] 
i=1 i=1 


Demonstração Seja Z = 5.4 X;. Então, pela Proposição 9.1, 
ElZ] =) ,Z6)p(s) 


ses 
=5(Xi(9) + X2(9) +... + Xn(9) p(S) 
ses 
=3 Xi(9p(9) + D Xo(s)p(s) +... + D Xn(9P(S) 
ses ses ses 
= E(X] + ELXo] + ... + ELX] E 


Exemplo 9c 


Determine o valor esperado da soma obtida quando n dados honestos são 
rolados. 


Solução Seja X a soma. Vamos computar E[X] usando a representação 
n 
pd >, 
i=1 


onde X, é o valor do dado i. Como X, tem a mesma probabilidade de ser qual- 
quer um dos valores de 1 a 6, obtém-se 


6 
E(X;] = > (1/6) =21/6=7/2 


i=1 
o que leva ao resultado 


HM=E pal uai 


i=l i=1 E 
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Exemplo 9d 


Determine o número esperado de sucessos que resultam de n tentativas quan- 
do a tentativa i tem probabilidade de sucesso p,i = 1,...,n. 


Solução Fazendo 


xo 1, sea tentativa i é um sucesso 
' O, sea tentativa i é um insucesso 


temos a representação 
n 
Hs 
i=1 
Consequentemente, 
n n 
EX]=> ElXJ=>,0: 
i=1 i=1 


Observe que esse resultado não requer que as tentativas sejam independen- 
tes. Ele inclui como caso especial o valor esperado de uma variável aleatória 
binomial, que assume tentativas independentes e que todas as probabilidades 
p; sejam iguais a p, tendo portanto média np. Ele também fornece o valor es- 
perado de uma variável aleatória hipergeométrica que representa o número 
de bolas brancas selecionadas, sem devolução, de uma urna com N bolas das 
quais m são brancas. Podemos interpretar a variável aleatória hipergeomé- 
trica como se representasse o número de sucessos em » tentativas, onde a 
tentativa i é chamada de sucesso se a i-ésima bola selecionada é branca. Como 
a i-ésima bola selecionada pode, com mesma probabilidade, ser qualquer uma 
das N bolas, tendo portanto probabilidade m/N de ser branca, tem-se que a 
variável aleatória hipergeométrica corresponde ao número de sucessos em 
n tentativas nas quais cada tentativa tem probabilidade de sucesso p = m/N. 
Portanto, embora essas tentativas hipergeométricas sejam independentes, 
tem-se como resultado do Exemplo 9d que o valor esperado de uma variável 
aleatória hipergeométrica é np = nm/N. [o 


Exemplo 9e 


Deduza uma expressão para a variância do número de tentativas no Exemplo 
9d que resultam em sucessos, e aplique-a para obter a variância de uma variá- 
vel aleatória binomial com parâmetros n e p. Aplique-a também para obter a 
variância de uma variável aleatória hipergeométrica igual ao número de bolas 
brancas escolhidas quando n bolas são escolhidas aleatoriamente de uma urna 
contento N bolas das quais m são brancas. 
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Solução Supondo que X represente o número de tentativas bem-sucedidas e 
usando a mesma representação de X — isto é, X = 5, X; — que utilizamos no 
exemplo anterior, temos 


EL] = E =x 5% 
i=1 j=1 


— - Dept + DDS 


i=1 jái 


= = 2d + ST Eua) (9.1) 


i=1 jái 
onde a equação final usou a igualdade Ao = X;. Entretanto, como os valores 
possíveis de X, e X, são iguais a O ou 1, tem-se que 


1, se X; = 1X; =1 


X;X; = sd 
Ed O, caso contrário 


Portanto, 


E(XX] — PlX, = 1,X,= 1) = P(tentativas i e j sejam sucessos) 


Agora, por um lado, se X é binomial, então, para i < j, os resultados da tenta- 
tivas i e j são independentes, com cada uma tendo probabilidade de sucesso p. 
Portanto, 


EIXX] = pij 


Juntamente com a Equação (9.1), a equação anterior mostra, para uma variável 
aleatória binomial X, 


EP] = np + n(n-Dp 
implicando que 


Var(X) = E[X] = (ELX]P = np + n(n = Dp?-nºp* = np(1 -p) 
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Por outro lado, se a variável aleatória X é hipergeométrica, então, dado que 
uma bola branca seja escolhida na tentativa i, cada uma das outras N — 1 bolas, 
das quais m — 1 são brancas, têm a mesma probabilidade de ser a j-ésima bola 
escolhida, para | * i. Consequentemente, para j = i, 


mm-l 
PX=LX=1)=PX,=DPX,=HX=h0=— 
M=1=0=PO6G=DPOG=16=0=[. 5 
Usando p; = m/N, obtemos agora, da Equação (9.1), 
nm mm-1 
EP] = — - Do 
= +"0- DN 
Consequentemente, 
nm mm-—l nm? 
V =— — 
ar(X) N + n(n DINDA (7) 


o que, conforme mostrado no Exemplo 8j, pode ser simplificado para 


n-—l 
Var(X) = np(1l — p) (1 CRE 1) 


onde p = m/N. ” 


4.10 PROPRIEDADES DA FUNÇÃO DISTRIBUIÇÃO CUMULATIVA 


Lembre que, para a função distribuição F de X, F(b) representa a probabilida- 
de de que a variável aleatória X assuma um valor menor ou igual a b. A seguir 
temos algumas propriedades da função distribuição cumulativa (f.d.c.) F: 


. Fé uma função não decrescente; isto é,se a < b, então F(a) = F(b). 
- lim F(b)=1 
boo 
- lim F(b)=0 
b— —co 
. Fé contínua à direita. Isto é, para qualquer b e qualquer sequência decres- 
cente b,,n = 1, que convirja para b, lim F(b) = F(b). 
hn (0,0) 


Ep WON mA 


Obtém-se a Propriedade 1 porque, conforme notado na Seção 4.1, para 
a<b,o evento [X = a) está contido no evento (X = b) e portanto não pode 
ter uma probabilidade maior. As propriedades 2, 3 e 4 resultam da proprie- 
dade da continuidade de probabilidades (Seção 2.6). Por exemplo, para pro- 
var a propriedade 2, observamos que se b, tende a oo, então os eventos (X = 
b,), n = 1, são eventos crescentes cuja união é o evento [X < o). Portanto, 
pela propriedade da continuidade de probabilidades, 


lim PX<b)=PX <oj=1 
n—>00 


o que prova a propriedade 2. 
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A prova da propriedade 3 é similar e por isso é deixada como exercício. 
Para provar a propriedade 4, observamos que se b, decresce em direção a b, 
então (X = b,),n = 1, são eventos decrescentes cuja interseção é [X = b). A 
propriedade da continuidade então determina que 


limP(X <by)=P(X = ob) 
n 


o que verifica a propriedade 4. 
Tudo o que se deseja saber a respeito de X pode ser obtido a partir de sua 
função distribuição cumulativa, F. Por exemplo, 


Pla<X=<b)=F(b)-F(a)paratodoa<b (8.1) 


A validade desta equação pode ser vista com mais clareza se escrevermos o 
evento [X = b] como sendo a união dos eventos mutuamente exclusivos [X = a) 
efa<X=<b).Istoé, 


(X=<=b)=(X<=aU(a<X=b) 
então 
PX=<=b)j=PX=sa+Pa<X=sb) 


o que estabelece a Equação (9.1). 
Se quisermos calcular a probabilidade de que X seja estritamente menor 
que b, podemos novamente aplicar a propriedade da continuidade para obter 


P(X < sy= (im rss = :)) 
(0.0) 
. 1 
= lim p(x=b- ) 
n—>00 n 
= lim r(b — :) 
n-—>00 n 


Note que P[X < b) não é necessariamente igual a F(b), já que F(b) também 
inclui a probabilidade de que X seja igual a b. 


Exemplo 10a 
A função distribuição da variável aleatória X é dada por 
x <0 


0Q=<x<l 
F(x) = l=x<?2 


Z2=x<3 


— Elis VI DI O 
NI 


3=x 
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F(x) 

— 

HW 

i 

2 ES < 

3 

ll 

2 
I ] x 
1 2 3 


Figura 4.8 Gráfico de F(x). 


Um gráfico de F(x) é apresentado na Figura 4.8. Calcule (a) P(X < 3), (b) P(X 
=1()PX>Ue(d)PL<X=<4. 


Solução (a) P(X < 31= lime [x <3- 5) = tim (S — :) ER 
n n n n 


EM 
(b) 
PX=H=PX=<I)-PWX<1) 
: 1 2 1 1 
(c) 
P|X > 5j=1-P[x=5) 
1 3 
=1 -P(5)=á 
(d) 
PL<X=<49=F(4 - FO) 
1 
a E 
RESUMO 


Uma função real definida a partir do resultado de um experimento probabilís- 
tico é chamada de variável aleatória. 
Se X é uma variável aleatória, então a função F(x) definida como 


Fx) =PX =x) 


é chamada de função distribuição de X. Todas as probabilidades relacionadas a 
X podem ser escritas em termos de F. 
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Uma variável aleatória cujo conjunto de valores possíveis é finito ou con- 
tavelmente finito é chamada de discreta. Se X é uma variável aleatória discreta, 
então a função 

p() = PAX =] 


é chamada de função discreta de probabilidade (ou simplesmente função de 
probabilidade) de X. Além disso, a grandeza E[X] definida como 


EX]= 5" xp) 


x:pQ)>0 


é chamada de valor esperado de X. E[X] é comumente chamada de média ou 
esperança de X. 
Uma útil identidade mostra que, para uma função g, 


ElgO]= >, gop() 


x:p(x)>0 
A variância de uma variável aleatória X, escrita Var(X), é definida por 


Var(X) = EUX — E[X]/] 


A variância, que é igual ao valor esperado do quadrado da diferença entre 
X e seu valor esperado, é uma medida da dispersão dos possíveis valores de X. 
Uma identidade útil é a seguinte 


Var(X) = EI] - (EX)? 


A grandeza /Var(X) é chamada de desvio padrão de X. 
Agora discutimos alguns tipos comuns de variáveis aleatórias discretas. A 
variável aleatória cuja função de probabilidade é dada por 


p(i) = ()ria - pri i=0,...n 


é chamada de variável aleatória binomial com parâmetros n e p. Tal variável 
aleatória pode ser interpretada como sendo o número de sucessos que ocorrem 
quando n tentativas independentes, cada uma das quais com probabilidade de 
sucesso p, são realizadas. Sua média e variância são dadas por 


E[X] = np Var(X) = np(1 — p) 
A variável aleatória X cuja função de probabilidade é dada por 
—AQi 
po=5— 1=0 


é chamada de variável aleatória de Poisson com parâmetro À. Se um grande nú- 
mero de tentativas independentes (ou aproximadamente independentes) são 
realizadas, cada uma com pequena probabilidade de sucesso, então o número 
de tentativas bem-sucedidas que se tem como resultado tem uma distribuição 
que é aproximadamente igual aquela de uma variável aleatória de Poisson. A 
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média e a variância de uma variável aleatória de Poisson são ambas iguais ao 
parâmetro À. Isto é, 


E[X] = Var(X) = À 


A variável aleatória X cuja função de probabilidade é dada por 


p()=p(1-p/ti=1,2,.. 


é chamada de variável aleatória geométrica com parâmetro p. Tal variável alea- 
tória representa o número da tentativa que levou ao primeiro sucesso quando 
cada tentativa tem probabilidade de sucesso p e é independente. Sua média e 
variância são dadas por 
Ea 
2 
p 


EMj=* vais 
p 


A variável aleatória X cuja função de probabilidade é dada por 
Ê j—1 ten E 
po=(121)ra pj izr 


é chamada de variável aleatória binomial negativa com parâmetros r e p. Essa 
variável aleatória representa o número da tentativa do i-ésimo sucesso quando 
cada tentativa tem probabilidade de sucesso p e é independente. Sua média e 
variância são dadas por 


E(X] = E Var(X) = Rei 
p p 


Uma variável aleatória hipergeométrica X com parâmetros n, N e m representa 
o número de bolas brancas selecionadas quando n bolas são escolhidas aleato- 
riamente de uma urna que contém N bolas das quais m são brancas. A função 
de probabilidade dessa variável aleatória é dada por 


DE. 


D)D= sm 
140) N 
n 
Com p = m/N, sua média e variância são 
—n 
= V = + 
EX] =np Var) = —npd — p) 


Uma propriedade importante do valor esperado é a de que o valor esperado 
de uma soma de variáveis aleatórias é igual à soma de seus respectivos valores 
esperados. Isto é, 


E SS = Seu 
= 


i=l 


41 


42 


43 


4.4 


4.5 
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PROBLEMAS 


Duas bolas são escolhidas aleatoriamente 
de uma urna que contém 8 bolas bran- 
cas, 4 pretas e 2 laranjas. Suponha que 
ganhemos R$2,00 para cada bola preta 
selecionada e percamos R$1,00 para cada 
bola branca selecionada. Suponha que X 
represente nossas vitórias. Qual são os va- 
lores possíveis de X e quais são as proba- 
bilidades associadas a cada valor? 

Dois dados honestos são rolados. Seja X 
igual ao produto dos dois dados. Calcule 
P(X=ijparai=1,..,36. 

Três dados são rolados. Supondo que cada 
um dos 6º = 216 resultados possíveis seja 
igualmente provável, determine as proba- 
bilidades associadas aos valores possíveis 
que X pode assumir, onde X é a soma dos 
3 dados. 

Cinco homens e 5 mulheres são classifi- 
cados de acordo com suas notas em uma 
prova. Suponha que não existam notas 
iguais e que todas as 10! classificações 
possíveis sejam igualmente prováveis. 
Faça X representar a melhor classificação 
obtida por uma mulher (por exemplo, X 
= 1 se a pessoa mais bem classificada for 
uma mulher). Determine P(X = i),i=1, 
2,3,...,8,9,10. 

Suponha que X represente a diferença 
entre o número de caras e coroas obti- 
do quando uma moeda é jogada n vezes. 
Quais são os possíveis valores de X? 


4.9 Repita o Exemplo 1b quando as bolas são 


selecionadas com devolução. 


4.10 No Exemplo id, calcule a probabilida- 


de condicional de que ganhemos i reais, 
dado que ganhemos algo; calcule-a para 
i=1,2,3. 


4.11 (a) Um inteiro N é selecionado aleato- 


riamente de (1,2.,..., (10), onde cada 
um dos números tem a mesma proba- 
bilidade de ser selecionado. Qual é a 
probabilidade de que N seja divisível 
por 3? por 5? por 7? por 15? por 105? 
Como sua resposta mudaria se (10) 
fosse trocado por (10) à medida que 
k se tornasse cada vez maior? 

(b) Uma importante função na teoria dos 
números — cujas propriedades estão 
relacionadas àquele que é considera- 
do um dos mais importantes proble- 
mas não resolvidos da matemática, 
a hipótese de Riemann -— é a função 
Môóbius u(n), definida para todos os 
valores n inteiros positivos da forma 
a seguir: fatore n em seus fatores pri- 
mos. Se houver um fator primo repeti- 
do,comoem12=2:2:30u49=7- 
7 então u(n) é igual a 0, por definição. 
Considere que N seja agora escolhi- 
do aleatoriamente a partir de (1,2... 
(10)%), onde k é grande. Determine 
P(y(N) = 0) à medida que k-=00. 

Dica: Para calcular P(u(N) * 0), use a 

identidade 


4.6 No Problema 4.5, para n =3,se a moeda é 


o p2 
honesta, quais são as probabilidades asso- O] apa = (4) (5) (5) (55) S/ES Es 
ciadas aos valores que X pode assumir? = BR 7 4/19/25) 149 m? 


4.7 Suponha que um dado seja rolado duas 


4.8 


vezes. Quais são os possíveis valores que 

as seguintes variáveis aleatórias podem 

assumir?: 

(a) o máximo valor que aparece nas duas 
vezes que o dado é jogado. 

(b) o mínimo valor que aparece nas duas 
vezes que o dado é jogado. 

(c) a soma das duas jogadas. 

(d) o valor da primeira jogada menos o 
valor da segunda jogada. 

Se o dado do Problema 4.7 é honesto, 

calcule as probabilidades associadas às 

variáveis aleatórias nas letras (a) a (d). 


onde P, é o i-ésimo menor fator primo. (O 
número 1 não é um fator primo.) 


4.12 No jogo de Morra Dois Dedos, 2 jogado- 


res mostram 1 ou 2 dedos e dizem simul- 
taneamente o número de dedos que o 
seu oponente irá mostrar. Se apenas um 
dos jogadores acertar, ele recebe uma 
quantidade (em reais) igual à soma dos 
dedos mostrados por ele e por seu opo- 
nente. Se ambos os jogadores acertarem 
ou se ambos errarem, então ninguém 
ganha nada. Considere um jogador espe- 
cífico e chame de X a quantidade de di- 


nheiro que ele ganha em um único jogo 

de Morra Dois Dedos. 

(a) Se cada jogador age independente- 
mente do outro, e se cada um deles faz 
a escolha do número de dedos que ele 
e seu oponente vão mostrar de forma 
tal que cada uma das possibilidades 
seja igualmente provável, quais são os 
valores possíveis de X e quais são as 
suas probabilidades associadas? 

(b) Suponha que cada jogador aja inde- 
pendentemente do outro. Se cada um 
dos jogadores decide mostrar o mes- 
mo número de dedos que ele imagi- 
na que seu oponente irá mostrar, e se 
cada jogador tem a mesma probabili- 
dade de mostrar 1 ou 2 dedos, quais 
são os valores possíveis de X e suas 
probabilidades associadas? 


4.13 Um vendedor agendou duas visitas para 


vender enciclopédias. Sua primeira visi- 
ta resultará em venda com probabilida- 
de 0,3, e sua segunda visita resultará em 
venda com probabilidade de 0,6, sendo 
ambas as probabilidades de venda inde- 
pendentes. Qualquer venda realizada tem 
a mesma probabilidade de ser do modelo 
luxo, que custa R$ 1000,00, ou do modelo 
padrão, que custa R$ 500,00. Determine 
a função de probabilidade de X, o valor 
total das vendas em reais. 


4.14 Cinco números distintos são aleatoriamente 


distribuídos entre jogadores numerados de 
1a5.Sempre que dois jogadores comparam 
os seus números, aquele com o maior nú- 
mero é declarado vencedor. Inicialmente, os 
jogadores 1 e 2 comparam os seus números. 
O vencedor então compara o seu número 
com aquele do jogador 3, e assim por dian- 
te. Suponha que X represente o número de 
vezes em que o jogador 1 é o vencedor. De- 
termine P(X = i),i=0,1,2,3,4. 


4.15 A loteria de novatos da Associação Na- 


cional de Basquete (NBA) envolve os 11 
times que tiveram a pior campanha duran- 
te o ano. Um total de 66 bolas é colocado 
em uma urna. Cada uma dessas bolas tem 
estampado o nome de um time: 11 tem o 
nome do time com a pior campanha, 10 
tem o nome do time com a segunda pior 
campanha, 9 tem o nome do time com a 
terceira pior campanha, e assim por diante 
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(com a bola 1 tendo o nome do time que 
teve a décima primeira pior campanha). 
Uma bola é sorteada e o time que tiver 
o seu nome estampado nesta bola tem a 
chance de fazer a primeira escolha den- 
tre um grupo de jogadores novatos que 
vão fazer a sua estreia na liga. Outra bola 
é então sorteada, e se ela “pertencer” a 
um time diferente daquele que recebeu a 
chance da primeira escolha, então o time 
à qual ela pertence tem a chance de fazer 
a segunda escolha dentre os jogadores 
novatos (se a bola pertencer ao time que 
recebeu a chance da primeira escolha, ela 
é então descartada e outra bola é escolhi- 
da; isso continua até que bola de um time 
diferente seja escolhida). Finalmente, mais 
uma bola é escolhida, e o time com o nome 
estampado nessa bola (desde que este seja 
diferente dos dois primeiros times) recebe 
a chance de fazer a terceira escolha. As es- 
colhas 4 a 11 remanescentes são então da- 
das como prêmio para os 8 times que “não 
ganharam na loteria” em ordem inversa à 
de suas campanhas. Por exemplo, se o time 
com a pior campanha não recebeu a chan- 
ce de fazer qualquer uma das 3 escolhas, 
então esse time recebe a quarta escolha. Se 
X representar a chance de escolha do time 
com a pior campanha, determine a função 
de probabilidade de X. 


4.16 No Problema 4.15, chame de time 1 0 


time com a pior campanha, time 2 aque- 
le com a segunda pior campanha, e assim 
por diante. Suponha que Y, represente o 
time que tenha a i-ésima chance de esco- 
lher um novato (assim, Y, = 3 se a primei- 
ra bola sorteada pertencer ao número 3). 
Determine a função de probabilidade de 
(a) Yi (b) Ye(o) Y, 


4.17 Suponha que a função distribuição de X 


seja dada por 


0 b<0 
i 0O=b<l 

F(b) = Ss l=b<2 
5 2<b<3 
1 3=<b 


(a) Determine P(X = i),i=1,2,3. 
(b) Determine PE<X<3. 


4.18 Quatro jogadas independentes de uma 


moeda honesta são feitas. Seja X o nú- 
mero obtido de caras. Esboce a função de 
probabilidade da variável aleatória X — 2. 


4.19 Se a função distribuição de X é dada por 


0 b<0 

: 0=b<1 

S lI=b<2 
F(b) = É 

5 2=b<3 

9 

To 3=b<3,5 

1 b=>35 


calcule a função de probabilidade de X. 


4.20 Um livro de jogos de azar recomenda a 


seguinte “estratégia de vitória” para o 
jogo de roleta: aposte R$ 1,00 no verme- 
lho. Se der vermelho (o que tem proba- 
bilidade de E de ocorrer), pegue o lucro 
de R$1,00 e desista. Se o vermelho não 
aparecer e você perder a aposta (o que 
tem probabilidade de 28 de ocorrer), faça 
apostas adicionais de R$ 1,00 no verme- 
lho em cada um dos próximos dois giros 
da roleta e então desista. Se X representa 
seu lucro quando você sair da mesa, 

(a) determine P[X > 0) 

(b) você está convencido de que a estra- 
tégia é de fato uma “estratégia de vi- 
tória”? Explique a sua resposta. 

(c) calcule E[X]. 


4.21 Quatro ônibus levando 148 estudantes da 


mesma escola chegam a um estádio de fu- 
tebol. Os ônibus levam, respectivamente, 
40,33,25 e 50 estudantes. Um dos estudan- 
tes é selecionado aleatoriamente. Suponha 
que X represente o número de estudantes 
que estavam no ônibus que levava o estu- 
dante selecionado. Um dos 4 motoristas 
dos ônibus também é selecionado aleato- 
riamente. Seja Y o número de estudantes 
no ônibus do motorista selecionado. 
(a) Qual valor esperado você pensa ser 
maior, E|X] ou E[Y]? 
(b) Calcule E[X] e E[Y]. 
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4.22 Suponha que dois times joguem uma série 


de partidas que termina quando um deles 
tiver ganhado i partidas. Suponha que cada 
partida jogada seja, independentemente, 
vencida pelo time A com probabilidade p. 
Determine o número esperado de partidas 
jogadas quando (a) i = 2 e (b) i = 3. Tam- 
bém, mostre em ambos os casos que este 
número é maximizado quando p = À. 


4.23 Você tem R$1000,00, e certa mercadoria 


é vendida atualmente por R$2,00 o quilo. 

Suponha que uma semana depois a mer- 

cadoria passe a ser vendida por R$1,00 

ou R$4,00 o quilo, com essas duas possi- 
bilidades sendo igualmente prováveis. 

(a) Se o seu objetivo é maximizar a quan- 
tidade esperada de dinheiro que você 
possuirá no final da semana, que es- 
tratégia você deve empregar? 

(b) Se o seu objetivo é maximizar a quan- 
tidade esperada de mercadoria que 
você possuirá no final da semana, que 
estratégia você deve empregar? 


4.24 A e B jogam o seguinte jogo: À escreve o 


número 1 ou o número 2,e B deve adivi- 
nhar que número foi escrito. Se o número 
que 4 escreveu é ie Bo adivinha, B rece- 
be i unidades de A. Se B erra sua tentati- 
va, B paga 3/4 de unidade a 4. Se B torna 
a sua escolha aleatória arriscando 1 com 
probabilidade p e 2 com probabilidade 1 
— p, determine seu ganho esperado se (a) 
A escreveu o número 1 e (b) se 4 escre- 
veu o número 2. 

Que valor de p maximiza o valor mí- 
nimo possível do ganho esperado de B,e 
qual é este valor? (Observe que o valor 
esperado do ganho de B não depende so- 
mente de p, mas também do que faz A.) 

Considere agora o jogador 4. Supo- 
nha que ele também torne a sua decisão 
aleatória, escrevendo o número 1 com 
probabilidade q. Qual é a perda esperada 
de A se (c) B escolher o número 1 e (d) B 
escolher o número 2? 

Que valor de g minimiza a máxima 
perda esperada de A? Mostre que o mí- 
nimo da perda máxima esperada de A é 
igual ao máximo do mínimo ganho es- 
perado de B. Este resultado, conhecido 
como o Teorema Minimax, foi estabeleci- 


do pelo matemático John von Neumann 
e é o resultado fundamental da disciplina 
da matemática conhecida como teoria 
dos jogos. O valor comum é chamado de 
valor do jogo para o jogador B. 


4.25 Jogam-se duas moedas. A primeira moeda 


dá cara com probabilidade 0,6, e a segun- 
da, com probabilidade 0,7. Suponha que 
os resultados das jogadas sejam indepen- 
dentes e que X seja igual ao número total 
de caras que saem. 

(a) Determine P(X = 1). 

(b) Determine E[X]. 


4.26 Escolhe-se aleatoriamente um número de 


1a 10. Você deve adivinhar que número 

foi escolhido perguntado questões com 

respostas do tipo “sim ou não” Calcule o 

número esperado de perguntas que você 

precisará perguntar em cada um dos ca- 
sos a seguir: 

(a) Sua i-ésima questão é do tipo “Foi o 
número i que saiu?) comi = 1,2,3,4, 
5,6,78,9,10. 

(b) Com cada pergunta você tenta elimi- 
nar metade dos números restantes, na 
medida do possível. 


4.27 Uma companhia de seguros vende uma 


apólice dizendo que uma quantidade 
A de dinheiro deve ser paga se algum 
evento É ocorrer em um ano. Se a com- 
panhia estima que E tem probabilidade p 
de ocorrer em um ano, que preço deve o 
cliente pagar pela apólice se o lucro espe- 
rado pela companhia é de 10%? 


4.28 Uma amostra de 3 itens é selecionada 


aleatoriamente de uma caixa contendo 20 
itens, dos quais 4 são defeituosos. Deter- 
mine o número esperado de itens defei- 
tuosos na amostra. 


4.29 Existem duas causas possíveis para a que- 


bra de certa máquina. Verificar a primeira 
possibilidade custa C, reais, e, se aquela ti- 
ver sido de fato a causa da quebra, o pro- 
blema pode ser reparado ao custo de R, 
reais. Similarmente, existem os custos €C, 
e R, associados à segunda possibilidade. 
Suponha que p e 1 —- p representem, res- 
pectivamente, as probabilidades de que a 
quebra seja causada pela primeira e pela 
segunda possibilidades. Em quais condi- 
ções de p,C,e R,i = 1,2, devemos verifi- 
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car inicialmente a primeira causa possível 
de defeito e depois a segunda, em vez de 
inverter a ordem de verificação, de forma 
a minimizarmos o custo envolvido na ma- 
nutenção da máquina? 

Nota: Se a primeira verificação for nega- 
tiva, devemos ainda assim verificar a se- 
gunda possibilidade. 


4.30 Uma pessoa joga uma moeda honesta até 


que dê coroa pela primeira vez. Se a co- 

roa aparece na n-ésima jogada, a pessoa 

ganha 2º reais. Seja X o número de vitó- 
rias do jogador. Mostre que E[X] = +00. 

Este problema é conhecido como o para- 

doxo de São Petesburgo. 

(a) Você pagaria R$ 1 milhão para jogar 
este jogo uma única vez? 

(b) Você pagaria R$ 1 milhão por cada 
jogo caso você pudesse jogar o tanto 
de partidas que quisesse e tivesse que 
pagar somente depois que parasse de 
jogar? 


4.31 A cada noite diferentes meteorologistas 


nos dão a probabilidade de chuva no dia 
seguinte. Para julgar quão boa é a pre- 
visão do tempo feita por essas pessoas, 
vamos classificá-las da forma a seguir: se 
um meteorologista diz que choverá com 
probabilidade p, então ele ou ela recebe- 
rá uma nota de 


1-(1-p) se chover 
1-p”se não chover 


Vamos então anotar as notas ao longo de 
um determinado período de tempo e con- 
cluir que o meteorologista com a maior 
nota média é aquele que melhor prevê o 
tempo. Suponha agora que certo meteo- 
rologista esteja ciente de nosso mecanis- 
mo de notas e queira maximizar sua nota 
esperada. Se essa pessoa acredita verda- 
deiramente que choverá amanhã com 
probabilidade p*, que valor de p ele ou 
ela deve declarar de forma a maximizar a 
nota esperada? 


4.32 Cem pessoas terão seu sangue examina- 


do para determinar se possuem ou não 
determinada doença. Entretanto, em vez 
de testar cada indivíduo separadamente, 
decidiu-se primeiro colocar as pessoas em 
grupos de 10. As amostras de sangue das 


4.33 


4.34 


4.35 


4.36 


4.37 


4.38 


10 pessoas de cada grupo serão analisadas 
em conjunto. Se o teste der negativo, ape- 
nas um teste será suficiente para as 10 pes- 
soas. Por outro lado, se o teste der positi- 
vo, cada uma das demais pessoas também 
será examinada e, no total, 11 testes serão 
feitos no grupo em questão. Suponha que 
a probabilidade de se ter a doença seja de 
0,1 para qualquer pessoa, de forma inde- 
pendente, e calcule o número esperado de 
testes necessários para cada grupo (ob- 
serve que supomos que o teste conjunto 
dará positivo se pelo menos uma pessoa 
no conjunto tiver a doença). 
Um jornaleiro compra jornais por 10 
centavos e vende-os por 15 centavos. En- 
tretanto, ele não pode retornar os jornais 
que não tiver vendido. Se sua demanda 
diária for uma variável aleatória binomial 
com n = 10,p = 1/3, aproximadamente 
quantos jornais ele deve comprar de for- 
ma a maximizar o seu lucro esperado? 
No Exemplo 4b, suponha que a loja de 
departamentos embuta um custo adicio- 
nal c por cada unidade de demanda não 
atingida (esse tipo de custo é frequen- 
temente chamado de custo goodwill 
porque a loja perde a boa vontade dos 
consumidores cuja demanda ela não foi 
capaz de suprir). Calcule o lucro espera- 
do quando a loja armazena s unidades, e 
determine o valor de s que maximiza o 
lucro esperado. 
Uma caixa contém 5 bolas de gude ver- 
melhas e 5 azuis. Duas bolas de gude são 
retiradas aleatoriamente. Se elas tiverem a 
mesma cor, você ganha R$1,10;se elas tive- 
rem cores diferentes, você ganha -R$1,00 
(isto é, você perde R$1,00). Calcule 
(a) o valor esperado da quantia que você 
ganha; 
(b) a variância da quantia que você ganha. 
Considere o Problema 4.22 com i = 2. 
Determine a variância do número de par- 
tidas jogadas e mostre que este número é 
maximizado quando p = À 
Determine Var(X) e Var(Y) para X e Y 
dados no Problema 21. 
Se E[X] = 1 e Var(X) = 5, determine 
(a) EI(Z + 2)] 
(b) Var(4 + 3X). 


4.39 


4.40 


4.41 


4.42 


4.43 


4.44 
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Uma bola é sorteada de uma urna que con- 
tém 3 bolas brancas e 3 bolas pretas. Após 
o seu sorteio, ela é recolocada na urna é 
então outra bola é sorteada. Esse processo 
segue indefinidamente. Qual é a probabili- 
dade de que, das primeiras 4 bolas sortea- 
das, exatamente 2 sejam brancas? 

Em um teste de múltipla escolha com 3 
respostas possíveis para cada uma das 5 
questões, qual é a probabilidade de que 
um estudante acerte 4 questões ou mais 
apenas chutando? 

Um homem diz ter percepção extrassen- 
sorial. Como um teste, uma moeda hones- 
ta é jogada 10 vezes e pede-se ao homem 
que preveja o resultado. Ele acerta 7 vezes 
em 10. Qual é a probabilidade de que ele 
consiga o mesmo índice de acertos mesmo 
não tendo percepção extrassensorial? 
Suponha que, durante o voo, de forma 
independente, os motores de um avião te- 
nham probabilidade 1 — p de falharem. Se 
um avião precisa da maioria de seus mo- 
tores operando para completar um voo 
de forma bem-sucedida, para que valores 
de p um avião com 5 motores é preferível 
em relação ao um avião de 3 motores? 
Um canal de comunicações transmite 
os algarismos O e 1. Entretanto, devido 
à interferência estática, um algarismo 
transmitido tem probabilidade 0,2 de ser 
incorretamente recebido. Suponha que 
queiramos transmitir uma mensagem im- 
portante formada por um único algarismo 
binário. Para reduzir as chances de erro, 
transmitimos 00000 em vez de O e 11111 
em vez de 1. Se o receptor da mensagem 
usa um decodificador de “maioria” qual é 
a probabilidade de que a mensagem não 
esteja correta quando decodificada? 

Um sistema de satélite é formado por n 
componentes e funciona em qualquer dia 
se pelo menos k dos n componentes fun- 
cionarem naquele dia. Em um dia chuvo- 
so, cada um dos componentes funciona 
independentemente com probabilidade 
P, enquanto em um dia seco eles funcio- 
nam com probabilidade p,. Se a probabi- 
lidade de chuva para amanhã é igual a «, 
qual é a probabilidade de que o sistema 
de satélite funcione? 


4.45 Um estudante se prepara para fazer uma 


importante prova oral e está preocupado 
com a possibilidade de estar em um dia 
“bom” ou em um dia “ruim” Ele pensa 
que se estiver em um dia bom, então cada 
um de seus examinadores irá aprová-lo, 
independentemente uns dos outros, com 
probabilidade 0,8. Por outro lado, se es- 
tiver em um dia ruim, essa probabilidade 
cairá para 0,4. Suponha que o estudante 
seja aprovado caso a maioria dos exami- 
nadores o aprove. Se o estudante pensa 
que tem duas vezes mais chance de estar 
em um dia ruim do que em um dia bom, 
é melhor que ele faça a prova com 3 ou 5 
examinadores? 


4.46 Suponha que sejam necessários pelo me- 


nos 9 votos de um júri formado por 12 
jurados para que um réu seja condenado. 
Suponha também que a probabilidade 
de que um jurado vote na inocência de 
uma pessoa culpada seja de 0,2, enquanto 
a probabilidade de que o jurado vote na 
culpa de uma pessoa inocente seja de 0,1. 
Se cada jurado age independentemente 
e se 65% dos réus são culpados, determi- 
ne a probabilidade de que o júri chegue 
à conclusão correta. Que percentual de 
réus é condenado? 


4.47 Em algumas cortes militares, 9 juízes são 


nomeados. Entretanto, tanto os advoga- 
dos de acusação quanto os de defesa têm 
o direito de contestar qualquer juiz, e nesse 
caso o juiz contestado é removido do caso 
sem ser substituído. Um réu é declarado 
culpado se a maioria dos juízes o conside- 
rar culpado. Do contrário, ele ou ela é de- 
clarado inocente. Suponha que quando o 
réu for de fato culpado, cada juiz irá (inde- 
pendentemente) condená-lo com probabi- 
lidade 0,7. Se em vez disso o réu for de fato 
inocente, essa probabilidade cai para 0,3. 
(a) Qual é a probabilidade de que um réu 
de fato culpado seja declarado culpa- 
do quando há (1) 9, (11) 8, (iii) 7 juízes? 
(b) Repita a letra (a) para um réu ino- 
cente. 
(c) Se o advogado de acusação não exer- 
cer o seu direito de contestar um juiz, 
e se a defesa tem direito a um máximo 
de duas contestações, quantas contes- 
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tações deve fazer o advogado de defe- 
sa se ele ou ela tiver 60% de certeza 
de que o cliente é culpado? 


4.48 Sabe-se que os disquetes produzidos por 


certa companhia têm probabilidade de de- 
feito igual a 0,01, independentemente uns 
do outros. A companhia vende os disque- 
tes em embalagens com 10 e oferece uma 
garantia de devolução se mais que 1 dis- 
quete em uma embalagem com 10 disque- 
tes apresentar defeito. Se alguém compra 3 
embalagens, qual é a probabilidade de que 
ele ou ela devolva exatamente 1 delas? 


4.49 A moeda 1 dá cara com probabilidade 


0,4; a moeda 2 tem probabilidade 0,7 de 
dar cara. Uma dessas moedas é escolhida 
aleatoriamente e jogada 10 vezes. 

(a) Qual é a probabilidade de que a 
moeda dê cara em exatamente 7 das 
10 jogadas? 

(b) Dado que a primeira dessas 10 joga- 
das dê cara, qual é a probabilidade 
condicional de que exatamente 7 das 
10 jogadas deem cara? 


4.50 Suponha que uma moeda viciada que 


dê cara com probabilidade p seja jogada 

10 vezes. Dado que um total de 6 caras 

tenha saído, determine a probabilidade 

condicional de que os 3 primeiros resul- 

tados sejam 

(a) A, t,t (significando que o primeiro re- 
sultado tenha sido cara, o segundo co- 
roa, € O terceiro coroa) 

(b) t,h,t. 


4.51 O número esperado de erros tipográficos 


em uma página de certa revista é igual a 
0,2. Qual é a probabilidade de que a pró- 
xima página que você leia contenha (a) O 
e (b) 2 ou mais erros tipográficos? 
Explique o seu raciocínio! 


4.52 O número médio mensal de acidentes 


aéreos envolvendo aviões comerciais em 

todo o mundo é igual a 3,5. Qual é a pro- 

babilidade de que 

(a) ocorram pelo menos 2 acidentes desse 
tipo no próximo mês? 

(b) ocorra no máximo 1 acidente no pró- 
ximo mês? 

Explique o seu raciocínio! 


4.53 Aproximadamente 80.000 casamentos fo- 


ram celebrados no estado de Nova York 


no ano passado. Estime a probabilidade 

de que, em pelo menos um desses casais, 

(a) ambos os parceiros tenham nascido 
no dia 30 de abril? 

(b) ambos os parceiros celebrem seu ani- 
versário no mesmo dia do ano? 

Explique suas hipóteses! 

4.54 Suponha que o número médio de carros 
abandonados semanalmente em certa au- 
toestrada seja igual a 2,2. Obtenha uma 
aproximação para a probabilidade de que 
(a) nenhum carro seja abandonado na se- 

mana que vem. 
(b) pelo menos 2 carros sejam abandona- 
dos na semana que vem. 

4.55 Certa agência de digitação emprega dois 
digitadores. O número médio de erros 
por artigo é de 3 quando este é digitado 
pelo primeiro digitador e 4,2 quando digi- 
tado pelo segundo. Se o seu artigo tem a 
mesma probabilidade de ser digitado por 
qualquer um dos digitadores, obtenha 
uma aproximação para a probabilidade 
de que ele não tenha erros. 

4.56 Quantas pessoas são necessárias para que 
a probabilidade de que pelo menos uma 
delas faça aniversário no mesmo dia que 
você seja maior que 3? 

4.57 Suponha que o número de acidentes que 
ocorrem em uma autoestrada em cada 
dia seja uma variável aleatória de Poisson 
com parâmetro À = 3. 

(a) Determine a probabilidade de que 3 
ou mais acidentes ocorram hoje. 

(b) Repita a letra (a) supondo que pelo 
menos 1 acidente ocorra hoje. 

4.58 Compare a aproximação de Poisson com 
a probabilidade binomial correta para os 
seguintes casos; 

(a) P(X = 2) quandon = 8,p = 0,1 
(b) P(X = 9) quando n = 10,p = 0,95. 
(c) PLX = 0) quando n = 10,p = 0,1. 
(d) P(X = 4] quandon = 9,p = 0,2. 

4.59 Se você compra um bilhete de loteria que 
concorre em 50 sorteios, em cada um dos 
quais sua chance de ganhar é de ,y, qual 
é a probabilidade (aproximada) de que 
você ganhe um prêmio 
(a) pelo menos uma vez? 

(b) exatamente uma vez? 
(c) pelo menos duas vezes? 
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4.60 O número de vezes em que uma pessoa 
contrai um resfriado em um dado ano é 
uma variável aleatória de Poisson com 
parâmetro À = 5. Suponha que a propa- 
ganda de uma nova droga (baseada em 
grandes quantidades de vitamina €) diga 
que essa droga reduz os parâmetros da 
distribuição de Poisson para À = 3 em 
75% da população. Nos 25% restantes, a 
droga não tem um efeito apreciável nos 
resfriados. Se um indivíduo experimentar 
a droga por um ano e tiver 2 resfriados 
naquele período, qual é a probabilidade 
de que a droga tenha trazido algum bene- 
fício para ele ou ela? 

4.61 A probabilidade de sair com um full hou- 
se em uma mão de pôquer é de aproxima- 
damente 0,0014. Determine uma aproxi- 
mação para a probabilidade de que, em 
1000 mãos de pôquer, você receba pelo 
menos 2 full houses. 

4.62 Considere n tentativas independentes, 
cada uma das quais levando aos resulta- 
dos 1...., k com respectivas probabilidades 
Pro Ph Dt,pi = 1. Mostre que, se to- 
das as probabilidades p, forem pequenas, 
então a probabilidade de que nenhum 
dos resultados das tentativas ocorra mais 
que uma vez é aproximadamente igual a 
exp(-n(n— 1) Dp2/2). 

4.63 Pessoas entram em um cassino a uma taxa 
de 1 a cada 2 minutos. 

(a) Qual é a probabilidade de que nin- 
guém entre 12:00 e 12:05? 

(b) Qual é a probabilidade de que pelo 
menos 4 pessoas entrem no cassino 
durante esse tempo? 

4.64 A taxa de suicídios em certo estado é de 1 
suicídio por 100.000 habitantes por mês. 
(a) Determine a probabilidade de que, em 

uma cidade de 400.000 habitantes loca- 
lizada no interior deste estado, ocorram 
8 suicídios ou mais em um dado mês. 

(b) Qual é a probabilidade de que em 
pelo menos 2 meses durante o ano 

- ocorram 8 suicídios ou mais? 

(c) Contando o mês atual como se fosse o 
mês número 1, qual é a probabilidade 
de que o primeiro mês tendo 8 suicídios 
ou mais seja o mês de número i,i = 1º 

Que hipóteses você está pressupondo? 


4.65 Cada um dos 500 soldados de uma com- 


panhia do exército tem probabilidade de 

1/10” ter certa doença, independentemen- 

te uns dos outros. Essa doença é diagnos- 

ticada por meio de um exame de sangue, 

e para facilitar o procedimento, amostras 

de sangue de todos os 500 soldados são 

coletadas e testadas. 

(a) Qual é a probabilidade (aproximada) 
de que o exame de sangue dê positivo 
(isto é, de que pelo menos uma pessoa 
tenha a doença). 

Suponha agora que o exame de sangue dê 

um resultado positivo. 

(b) Qual é a probabilidade, nessa circuns- 
tância, de que mais de uma pessoa te- 
nha a doença? 

Uma das 500 pessoas é João, que sabe 

que tem a doença. 

(c) Qual é, na opinião de João, a proba- 
bilidade de que mais de uma pessoa 
tenha a doença? 

Como o teste em grupo deu positivo, as 

autoridades decidiram testar cada indi- 

víduo separadamente. Os primeiros i — 1 

desses testes deram negativo, e o i-ésimo 

teste, que é o de João, deu positivo. 

(d) Dado o cenário anterior, qual é a pro- 
babilidade, em função de i, de que 
qualquer uma das pessoas restantes 
tenham a doença? 


4.66 Um total de 2n pessoas consistindo de n 


casais senta-se aleatoriamente em uma 

mesa redonda, com cada uma das dispo- 

sições de assento sendo igualmente prová- 
vel. Suponha que C, represente o evento 
em que os membros do casal i estejam sen- 

tados um ao lado do outro, i = 1,...,n. 

(a) Determine P(C,) 

(b) Para j  i, determine P(C|C)). 

(c) Obtenha um valor aproximado para 
a probabilidade, com n grande, de 
que nenhum casal se sente ao lado de 
outro. 


4.67 Repita o problema anterior quando a 


disposição das pessoas na mesa é alea- 
tória mas sujeita à restrição de que ho- 
mens e mulheres devam estar sentados 
alternadamente. 


4.68 Em resposta ao ataque de 10 mísseis, 500 


mísseis antiaéreos são lançados. Os alvos 
dos mísseis antiaéreos são independen- 


4.69 


4.70 


41 


4.72 
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tes, e cada míssil antiaéreo pode ter, com 
igual probabilidade, qualquer um dos 10 
mísseis como alvo. Se cada míssil antiaé- 
reo atinge o seu alvo independentemente 
com probabilidade 0,1, use o paradigma 
de Poisson para obter um valor aproxi- 
mado para a probabilidade de que todos 
os mísseis sejam atingidos. 
Uma moeda honesta é jogada 10 vezes. 
Determine a probabilidade de ocorrência 
de uma série de 4 caras consecutivas 
(a) usando a fórmula deduzida no texto; 
(b) usando as equações recursivas dedu- 
zidas no texto. 

(c) Compare a sua resposta com aquela 
dada pela aproximação de Poisson. 
No instante de tempo 0, uma moeda que 
dá cara com probabilidade p é jogada e cai 
no chão. Em instantes de tempo escolhi- 
dos de acordo com um processo de Pois- 
son com taxa À, a moeda é recolhida e jo- 
gada novamente (entre esses instantes de 
tempo a moeda permanece no chão). Qual 
é a probabilidade de que a moeda esteja 

mostrando cara no instante de tempo t? 
Dica: Qual seria a probabilidade condi- 
cional se não houvesse jogadas adicionais 
a partir de t, e qual seria essa probabili- 
dade caso houvesse jogadas adicionais a 
partir de 1? 
Considere uma roleta de 38 números com 
números de 1 a 36, um O e um duplo 0. Se 
João sempre aposta que o resultado seja 
um dos números de 1 a 12, qual é a proba- 
bilidade de que 
(a) João perca suas 5 primeiras apostas; 
(b) sua primeira vitória ocorra em sua 
quarta aposta? 
Duas equipes de atletismo jogam uma sé- 
rie de partidas; a primeira a ganhar 4 par- 
tidas é declarada vencedora. Suponha que 
uma das equipes seja mais forte do que a 
outra e que vença cada partida com pro- 
babilidade 0,6, independentemente dos 
resultados das demais partidas. Determi- 
ne a probabilidade, para i = 4,5,6, 7 de 
que a equipe mais forte vença a série em 
exatamente i partidas. Compare a proba- 
bilidade de vitória da equipe mais forte 
com a probabilidade dela vencer 2 parti- 
das em uma série de 3. 


4.73 Suponha no Problema 4.72 que os dois ti- 
mes tenham o mesmo nível e que portan- 
to tenham probabilidade 1 de vencer cada 
partida. Determine o número esperado 
de partidas jogadas. 

4.74 Uma entrevistadora tem consigo uma lis- 
ta de pessoas que pode entrevistar. Se ela 
precisa entrevistar 5 pessoas, e se cada 
pessoa concorda (independentemente) 
em ser entrevistada com probabilidade ã, 
qual é a probabilidade de que a sua lista 
permita que ela consiga obter o número 
necessário de entrevistas se ela contiver 
(a) 5 pessoas e (b) 8 pessoas? Na letra (b), 
qual é a probabilidade de que a entrevista- 
dora fale com exatamente (c) 6 pessoas e 
(d) 7 pessoas da lista? 

4.75 Uma moeda honesta é jogada continua- 
mente até que dê cara pela décima vez. 
Seja X o número de coroas que aparecem. 
Calcule a função de probabilidade de X. 

4.56 Resolva o problema de pareamento de 
Banach (Exemplo 8e) se a caixa de fósfo- 
ros no bolso esquerdo contiver original- 
mente N, fósforos e a caixa no bolso di- 
reito contiver originalmente N, fósforos. 

4.77 No problema da caixa de fósforos de Ba- 
nach, determine a probabilidade de que, 
no momento em que a primeira caixa for 
esvaziada (em vez de ser encontrada va- 
zia), a outra caixa contenha k fósforos. 

4.78 Uma urna contém 4 bolas brancas e 4 bo- 
las pretas. Escolhemos aleatoriamente 4 
bolas. Se 2 delas são brancas e 2 são pre- 
tas, paramos. Do contrário, colocamos de 
volta as bolas na urna e novamente sele- 
cionamos 4 bolas de forma aleatória. Isso 
continua até que 2 das quatro bolas sejam 
brancas. Qual é a probabilidade de que 
façamos exatamente n seleções? 

4.79 Suponha que um conjunto de 100 itens 
contenha 6 itens defeituosos e 94 que fun- 
cionem normalmente. Se X é o número de 
itens defeituosos em uma amostra de 10 
itens escolhidos aleatoriamente do con- 
junto, determine P(X = 0) e (b) P(X > 2). 

4.80 Um jogo popular nos cassinos de Neva- 
da é o Keno, que é jogado da seguinte 
maneira: 20 números de 1 a 80 são sor- 
teados aleatoriamente pelo cassino. Um 
apostador pode selecionar de 1 a 15 nú- 
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meros; ele ganha se alguma fração dos 
números que escolheu for igual a qual- 
quer um dos 20 números sorteados pela 
casa. O prêmio é função do número de 
elementos selecionados pelo aposta- 
dor e do número de acertos obtido. Por 
exemplo, se o apostador selecionar ape- 
nas 1 número, então ele ou ela vence se 
este número estiver entre o conjunto de 

20 números sorteados, e o prêmio é de 

R$2,20 para cada real apostado (como a 

probabilidade de o apostador ganhar é 

nesse caso igual a à, é claro que o prêmio 

“justo” deveria ser R$3,00 para cada real 

apostado). Quando o jogador seleciona 2 

números, um prêmio de R$12,00 é dado 

para cada real apostado se ambos os nú- 

meros estiverem entre os 20. 

(a) Qual seria o prêmio justo neste caso? 

Suponha que P, , represente a probabili- 

dade de que exatamente k dos n números 

escolhidos pelo apostador estejam entre 
os 20 selecionados pela casa. 

(b) Calcule P,,. 

(c) A aposta mais comum no Keno con- 
siste na seleção de 10 números. Para 
tal aposta, o cassino distribui prêmios 
de acordo com a tabela a seguir. Cal- 
cule o prêmio esperado: 


Premiação no Keno para apostas de 10 números 


Número Reais ganhos 

de acertos para cada real apostado 

0-4 -1 

> 1 

6 17 

7 179 

8 1.299 

9 2.599 

10 24.999 


4.81 No Exemplo 8i, que percentual de i lotes 
defeituosos é rejeitado pelo comprador? 
Determine esse percentual para i = 1,4. 
Dado que o lote é rejeitado, qual é a pro- 
babilidade condicional de que ele conte- 
nha 4 componentes defeituosos? 

4.82 Um comprador de transistores os compra 
em lotes de 20. É usual que ele inspecione 
aleatoriamente 4 componentes de um lote 
e que aceite este lote apenas se nenhum 
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dos 4 apresentar defeitos. Se cada compo- 
nente de um lote é, independentemente 
dos demais, defeituoso com probabilidade 
0,1, qual é a proporção de lotes rejeitados? 

4.83 Há três autoestradas em um país. O núme- 
ro de acidentes que ocorrem diariamente 
nessas autoestradas é uma variável aleató- 
ria de Poisson com respectivos parâmetros 
0,3, 0,5 e 0,7 Determine o número espera- 
do de acidentes que vão acontecer hoje 
em qualquer uma dessas autoestradas. 

4.84 Suponha que 10 bolas sejam colocadas 
em 5 caixas, com cada uma das bolas sen- 
do independentemente colocada na caixa 
i com probabilidade p, 5 ,pi=1. 


(a) Determine o número esperado de cai- 
xas sem nenhuma bola. 

(b) Determine o número esperado de cai- 
xas com exatamente 1 bola. 

4.85 Existem cupons de desconto de n tipos. 
Independentemente dos tipos de cupons 
recolhidos previamente, cada novo 
cupom recolhido tem probabilidade p,, 
Bt pi = 1, de ser do tipo i. Se n cupons 
são recolhidos, determine o número es- 
perado de tipos distintos neste conjunto 
(isto é, determine o número esperado de 
tipos de cupons que aparecem pelo me- 
nos uma vez no conjunto de n cupons). 


EXERCÍCIOS TEÓRICOS 


4.1 Existem N tipos distintos de cupons de des- 
conto, e cada vez que um deles é recolhido, 
ele tem probabilidade P, i = 1,..., N, de ser 
de qualquer tipo, independentemente das 
escolhas anteriores. Suponha que T' repre- 
sente o número de cupons que alguém pre- 
cise selecionar para obter pelo menos um 
cupom de cada tipo. Calcule P(T = n]). 
Dica: Use um argumento similar àquele 
usado no Exemplo le. 

4.2 Se X tem função distribuição F, qual é a 
função distribuição de e*? 

4.3 Se X tem função distribuição F, qual é a 
função distribuição da variável aleatória 
a«X + B,onde a e 8 são constantes, a 0. 

4.4 Para uma variável aleatória inteira não 
negativa N, mostre que 


EIN|=5 PN =i) 
i=1 


[2,8] oO o 
Dica:3 PIN = )=5 5 PIN =k)jAgo- 
i=1 i=tk=i 
ra troque a ordem da soma. 
4.5 Para uma variável aleatória inteira não 
negativa N, mostre que 
o 1 
DOiPIN > d= 5 (EIN? — EIN) 
i=0 
oo oo 00 
Dicas iPN > )=)%i5% PN=h. 
i=0 i=0 k=i+] 
Agora troque a ordem da soma. 


4.6 Se X tal que 
PiX=1)=p=1-P(X=—1) 


determine c 1 tal que E[c*] = 1. 

4.7 Seja X uma variável aleatória com valor 
esperado q e variância o”. Determine o 
valor esperado de 


X-—u 
o 


4.8 Determine Var(X) se 
PM(X=a)=p=1-P(X=b) 


Y= 


4.9 Mostre como a dedução das probabilida- 
des binomiais 


P(X=ij= (ria — pr, i=0,...,n 


leva a uma demonstração do teorema bi- 
nomial 
n 


« +) = a (er 


i=0 


quando x e y são não negativos. 
5 . Ps 
Dica: Suponha p = as E 
4.10 Suponha que X seja uma variável alea- 
tória binomial com parâmetros n e p. 


Mostre que 
| 1 | 1-(1- py 
X+1) 0 nNn+Dp 


4.11 Considere n tentativas independentes, 


cada uma das quais com probabilidade de 
sucesso p. Se há um total de k sucessos, 
mostre que cada um dos n!/[k!(n — k)!] ar- 
ranjos possíveis dos k sucessos e dos n — k 
fracassos é igualmente provável. 


4.12 Hán componentes alinhados em um arran- 


jo linear. Suponha que cada componente 
funcione, independentemente dos demais, 
com probabilidade p. Qual é a probabilida- 
de de que 2 componentes instalados lado a 
lado não apresentem defeito? 

Dica: Condicione no número de compo- 
nentes defeituosos e use os resultados do 
Exemplo 4c do Capítulo 1. 


4.13 Seja X uma variável aleatória binomial 


com parâmetros (n,p). Que valor de p ma- 
ximiza P(X = k),k = 0,1,...,n? Este é um 
exemplo de método estatístico usado para 
estimar p quando uma variável aleatória 
binomial (n, p) tem valor k. Se assumimos 
que n é conhecido, então estimamos p es- 
colhendo o valor de p que maximiza P(X 
= k). Este é conhecido como o método de 
estimação por máxima verossimilhança. 


4.14 Uma família tem n filhos com probabili- 


dade ap",n = 1,onde o = (1- p)/p. 

(a) Que proporção de famílias não tem 
filhos? 

(b) Se cada filho tem a mesma probabili- 
dade de ser um menino ou uma meni- 
na (independentemente um do outro), 
que proporção de famílias é formada 
por k meninos (e qualquer número de 
meninas)? 


4.15 Suponha que n jogadas independentes de 


uma moeda que tem probabilidade p de 
dar cara sejam feitas. Mostre que a proba- 
bilidade de sair um número par de caras 
é de d[l + (q-p)'], onde q = 1 — p. Faça 
isso demonstrando e então utilizando a 
identidade 


pari 
(jr =5[p +" + (q — py] 


onde [n/2] é o maior número inteiro menor 
ou igual a n/2. Compare este exercício com 
o Exercício Teórico 3.5 do Capítulo 3. 


4.16 Seja X uma variável aleatória de Poisson 


com parâmetro À. Mostre que P(X = i) 
cresce monotonicamente e então decres- 
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ce monotonicamente à medida que i cres- 
ce, atingindo o seu máximo quando i é o 
maior inteiro não excedendo À. 

Dica: Considere P[X = i/P[X =i— 1). 


4.17 Seja X uma variável aleatória de Poisson 


com parâmetro À. 
(a) Mostre que 


P(X é par) = : [1 4 2] 


usando o resultado do Exercício Teórico 

4.15 e a relação entre as variáveis aleató- 

rias binomial e de Poisson. 

(b) Verifique a fórmula da letra (a) fazen- 
do uso direto da expansão de e” + é. 


4.18 Seja X uma variável aleatória de Poisson 


com parâmetro À. Que valor de À maximi- 
za P(X =k)],k=0? 


4.19 Mostre que, se X é uma variável aleatória 


de Poisson com parâmetro À, então 
EX] = AE(MX + DY 


Agora use esse resultado para calcular 
EX). 


4.20 Considere n moedas, cada uma das quais 


com probabilidade independente p de 

dar cara. Suponha que n seja grande e p 

pequeno, e considere A=np. Suponha que 

todas as n moedas sejam jogadas; se pelo 
menos uma delas der cara, o experimento 
termina; do contrário, jogamos novamen- 

te as n moedas, e assim por diante. Isto é, 

paramos assim que uma das n moedas der 

cara pela primeira vez. Seja X o número 
total de caras que aparecem. Qual dos 

raciocínios a seguir relacionados com a 

aproximação P(X = 1) está correto (em 

todos os casos, Y é uma variável aleatória 

de Poisson com parâmetro À)? 

(a) Como o número total de caras que 
saem quando n moedas são jogadas é 
aproximadamente uma variável alea- 
tória de Poisson com parâmetro À, 


PtX=1W]=P[Y=1)=1e" 


(b) Como o número total de caras que 
saem quando n moedas são jogadas é 
aproximadamente uma variável alea- 
tória de Poisson com parâmetro À, e 
como paramos quando esse número é 
positivo, 

Ae 


PX==PW=iy>0=—U— 
l-eA 
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4.21 


(c) Como pelo menos uma moeda dá 
cara, X será igual a 1 se nenhuma das 
demais n —- 1 moedas der cara. Como 
o número de caras que resulta des- 
sas n — 1 moedas é aproximadamen- 
te uma variável aleatória de Poisson 
com média (n-1D)p=A, 


PX=1]=PY=0|=e! 


De um conjunto de n pessoas escolhidas 
aleatoriamente, suponha que E, represen- 
te o evento em que as pessoas í e j fazem 
aniversário no mesmo dia. Suponha que 
cada pessoa tenha a mesma probabilida- 
de de fazer aniversário em qualquer um 
dos 365 dias do ano. Determine 

(a) P(Es dE, 2): 

(b) PE, E ,o); 

(c) P(E,5E,2 N Es). 

O que pode você concluir de suas respos- 
tas paras as letras (a)-(c) sobre a indepen- 


dência dos ( ” Jeventos E? 
2 j 


4.22 Uma urna contém 2n bolas, das quais 2 


4.23 


recebem o número 1,2 recebem o núme- 
ro 2,...,e 2 recebem o número n. Bolas são 
retiradas duas a duas de cada vez sem se- 
rem devolvidas. Seja 7 a primeira seleção 
na qual as bolas retiradas têm o mesmo 
número (e faça com que ela seja igual a 
infinito se nenhum dos pares sacados ti- 
ver o mesmo número). Queremos mos- 
trar que, para0<a<1, 


limPiT > anj=e*? 
n 


Para verificarmos a fórmula anterior, su- 
ponha que M, represente o número de 
pares retirados nas primeiras k seleções, 
k =1,.,n. 

(a) Mostre que, quando n é grande, M, 
pode ser considerado o número de 
sucessos em k tentativas (aproxima- 
damente) independentes. 

(b) Obtenha uma aproximação para 
P(M, = 0] quando n é grande. 

(c) Escreva o evento (T > an] em termos 
do valor de uma das variáveis M,. 

(d) Verifique a probabilidade limite dada 
para P(T > an] 

Considere um conjunto aleatório de n indi- 

víduos. Ao obter uma aproximação para o 

evento em que 3 desses indivíduos não fa- 


zem aniversário no mesmo dia, uma apro- 

ximação de Poisson melhor do que aquela 

obtida no texto (pelo menos para valores 
de n entre 80 e 90) é obtida supondo-se que 

E, seja o evento em que ocorrem pelo me- 

nos 3 aniversários no dia i, i = 1,...,365. 

(a) Determine P(E)). 

(b) Obtenha uma aproximação para a 
probabilidade de que 3 indivíduos 
não compartilhem a mesma data de 
aniversário. 

(c) Avalie à aproximação anterior quan- 
do n = 88 (o que pode ser demonstra- 
do ser o menor valor de n para o qual 
a probabilidade é maior que 0,5). 


4.24 Eis outra maneira de se obter um con- 


4.25 


junto de equações recursivas para deter- 

minar P,, a probabilidade de que apa- 

reça uma série de k caras consecutivas 
em uma sequência de n jogadas de uma 
moeda honesta que dê cara com proba- 

bilidade p: 

(a) Mostre que, para k < n, haverá uma 
série de k caras consecutivas em uma 
das condições a seguir: 

1. uma série de k caras consecutivas apa- 
rece nas primeiras n — 1 jogadas, ou 

2. não há série de k caras consecutivas 

nas primeiras n — k — 1 jogadas, a joga- 

dan-—k dá coroa, e as jogadas n — k + 

1,...,n dão cara. 

Usando as condições anteriores, rela- 

cione P, a P, , Começando com P, = 
p*,a fórmula recursiva pode ser usada 
para obter P,.,, depois P,.,,, e assim 
por diante, até P,. 

Suponha que o número de eventos que 

ocorrem em um tempo especificado é 

uma variável aleatória de Poisson com 

parâmetro À. Se cada evento é contado 
com probabilidade p, independentemen- 
te de qualquer outro evento, mostre que 

o número de eventos contados é uma va- 

riável aleatória de Poisson com parâme- 

tro Ap. Além disso, forneça um argumen- 
to intuitivo para justificar essa hipótese. 

Como uma aplicação do resultado ante- 

rior, suponha que o número de depósitos 

de urânio distintos em uma determinada 
área seja uma variável aleatória de Pois- 
son com parâmetro À = 10. Se, em um 
período de tempo fixo, cada depósito for 


(b) 


i=n+l 


descoberto de forma independente com 
probabilidade 3, determine a probabili- 
dade de que (a) exatamente 1, (b) pelo 
menos 1 e (c) no máximo 1 depósito seja 
descoberto durante aquele tempo. 


4.26 Demonstre que 


Dica: Use integração por partes. 


4.27 Se X é uma variável aleatória geométrica, 


mostre analiticamente que 
PX=n+kX>n)=P(X=k) 


Usando a interpretação da variável alea- 
tória geométrica, forneça um argumento 
verbal para o porquê da equação anterior 
ser verdade. 


4.28 Seja X uma variável aleatória binomial 


negativa com parâmetros r e p,e Y uma 
variável aleatória binomial com parâme- 
tros n e p. Mostre que 


PtX>n])=P(Y<r) 


Dica: Pode-se tentar uma demonstração 
analítica para a equação anterior, o que é 
equivalente a provar a identidade 


EO rsrs) 


i=0 
xp — py 


ou tentar uma demonstração que use a 
interpretação probabilística dessas va- 
riáveis aleatórias. Isto é, no último caso, 
comece considerando uma sequência de 
tentativas independentes com mesma 
probabilidade de sucesso p. Depois, tente 
expressar os eventos (X >n)e(Y <r)em 
termos dos resultados dessa sequência. 


4.29 Para uma variável aleatória hipergeomé- 


trica, determine 
P(X=k+IVPX =k) 


4.30 Uma urna contém bolas numeradas de 1 


a N. Suponha que n,n = N, dessas bolas 
sejam selecionadas sem devolução. Su- 
ponha que Y represente o maior número 
selecionado. 


(a) Determine a função de probabilidade 
de Y. 
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4.32 


4.33 


4.34 


4.35 
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(b) Deduza uma expressão para E[Y] e 
então use a identidade combinatória 
de Fermat (veja o Exercício Teórico 
1.11) para simplificá-la. 

Um pote contém m + n pedras, numera- 

das 1,2,...,n + m. Um conjunto de tama- 

nho n é retirado do pote. Se X representar 

o número retirado de pedras cujo número 

é maior do que cada um dos números das 

pedras restantes, calcule a função de pro- 

babilidade de X. 

Um pote contém n pedras. Suponha que 

um garoto tire uma pedra do pote suces- 

sivamente, recolocando a pedra retirada 
antes de tirar a próxima. O processo con- 
tinua até que o garoto retire pela segunda 
vez uma pedra já retirada. Suponha que 

X represente o número de vezes que o 

menino retira uma pedra, e calcule a sua 

função de probabilidade. 

Mostre que a Equação (8.6) pode ser de- 

duzida da Equação (8.5). 

De um conjunto de n elementos, esco- 

lhe-se aleatoriamente um subconjunto 

não nulo (cada um dos subconjuntos 
não nulos tem a mesma probabilidade 
de ser escolhido). Seja X o número de 
elementos do subconjunto escolhido. 

Usando as identidades dadas no Exer- 

cício Teórico 1.12, mostre que 


n 
EX] = REI 
o 
.92n-2. n—2 
Var) = n.2 n(n + 1)2 


e = 
Mostre também que, para n grande, 


Var) : 


seguindo o raciocínio de que a razão en- 
tre Var(X) e n/4 tende a 1 à medida que 
n tende a infinito. Compare esta fórmu- 
la com a forma limite de Var(Y) quando 
PY =i)=1In,i=1,.,n. 

Uma urna contém inicialmente uma 
bola vermelha e uma bola azul. Em 
cada rodada, uma bola é sorteada e en- 
tão substituída por outra de mesma cor. 
Suponha que X represente o número 
da seleção da primeira bola azul. Por 
exemplo, se a primeira bola selecionada 
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é vermelha e a segunda é azul, então X é 

igual a 2. 

(a) Determine P(X >ij,i=1. 

(b) Mostre que, com probabilidade 1, 
uma bola azul acabará sendo escolhi- 
da (isto é, mostre que PjX < 0] = 1). 

(c) Determine E[X]. 


4.36 Suponha que os possíveis valores de X se- 


41 


4.2 


43 


4.4 


4.5 


4.6 


jam [x], os possíveis valores de Y sejam [y)], 
e os possíveis valores de X + Y sejam [z,). 
Suponha que A, represente o conjunto de 
todos os pares de índices (i,j) tais que x, + 
y = Zpistoé,A, = Wi: + y;— zu. 

(a) Mostre que 

PX+Y=u= 5 PX=a,Y=9)) 

(DEAr 


(b) Mostre que 
EX +Y=5 5 G+mPX=, 
k (DeAr 
Y=y;) 
(c) Usando a fórmula da letra (b), mostre 
que 
EX + Y]=5 5 + »PX=a, 
| 
Y=yj) 
(d) Mostre que 
PX=m)=) PX=m,Y=y), 
j 
PYr=y)=>5 PX=m,Y =) 
(e) Demonstre que 
EIX + Y] = E[X] + E[Y] 


PROBLEMAS DE AUTOTESTE E EXERCÍCIOS 


Suponha que a variável aleatória X seja 
igual ao número de acertos obtidos por 
certo jogador de beisebol nas suas três 
chances como rebatedor. Se P(X = 1) = 
03,PX=2)=02eP[X=0)=3P(X = 
3), determine E[X]. 
Suponha que X assuma um dos valores 0, 
1,e 2. Se para alguma constante c, P(X = i] 
=cPlX=i-1],i= 1,2, determine ELX]. 
Uma moeda com probabilidade p de dar 
cara é jogada até que dê cara ou coroa 
duas vezes. Determine o número espera- 
do de jogadas. 
Certa comunidade é composta por m 
famílias, n, das quais têm i filhos, 3, n;= 
i=1 
m. Se uma das famílias for escolhida ale- 
atoriamente, suponha que X represente 
o número de filhos daquela família. Se 
um dos » in; filhos for escolhido aleato- 
Manieiio suponha que Y seja o número 
total de filhos da família daquela criança. 
Mostre que E[Y] = E(X]. 
Suponha que P(X=0]=1-P(X=1).Se 
E[X] = 3Var(X), determine P(X = 0). 
Há duas moedas em uma lata. Uma delas 
tem probabilidade de 0,6 de dar cara; a ou- 


tra tem probabilidade de 0,3 de dar cara. 
Uma dessas moedas é escolhida aleato- 
riamente e depois jogada. Sem saber qual 
moeda foi escolhida, você pode apostar 
qualquer quantia até 10 reais, ganhando 
se der cara e perdendo se der coroa. Supo- 
nha, contudo, que alguém queira vender 
para você, por uma quantia C€, a informa- 
ção de qual moeda foi selecionada. Quan- 
to você espera ganhar se comprar essa in- 
formação? Note que se você comprá-la € 
então apostar x, você ganhará x — C ou -x 
— € (isto é, perderá x + C no último caso). 
Além disso, para que valores de € valeria 
a pena comprar a informação? 


4.7 Um filantropo escreve um número posi- 


tivo x em um pedaço de papel vermelho, 
mostra o papel a um observador imparcial, 
e então o coloca sobre a mesa com a face 
escrita para baixo. O observador então 
joga uma moeda honesta. Se der cara, ele 
escreve o valor 2x em um pedaço de papel 
azul, que é então colocado sobre a mesa 
com a face escrita para baixo. Se der coroa, 
ele escreve o valor x/2 neste mesmo papel. 
Sem saber o valor de x ou se a moeda deu 
cara ou coroa, você tem a opção de virar 
para cima o papel vermelho ou o azul. 


Após fazer isso e observar o número es- 

crito no papel, você deve escolher entre 

receber como prêmio aquela quantia ou 

a quantia (desconhecida) escrita no outro 

pedaço de papel. Por exemplo, se você es- 

colher virar o papel azul e observar o va- 
lor de 100, então você pode escolher entre 

aceitar 100 como seu prêmio ou assumir o 

valor escrito no papel vermelho, que pode 

ser de 200 ou 50. Suponha que você queira 
que sua recompensa esperada seja grande. 

(a) Mostre que não há motivo para virar 
o papel vermelho primeiro, porque, se 
você fizer isso, então não importará o 
valor que você observar. Em outras 
palavras, mostre que será sempre me- 
lhor optar pelo papel azul. 

(b) Suponha que y seja um valor não nega- 
tivo fixo e considere a seguinte estraté- 
gia: vire o papel azul e, se o valor escri- 
to for pelo menos igual a y, então aceite 
aquela quantia. Se for menor que y, en- 
tão troque pelo papel vermelho. Supo- 
nha que R(x) represente a recompensa 
obtida se o filantropo escrever a quan- 
tia x e você empregar a estratégia des- 
crita. Obtenha E[Ry (x)]. Observe que 
E[Ro(x)] é a recompensa esperada se o 
filantropo escrever a quantia x quando 
você empregar a estratégia de sempre 
escolher o papel azul. 


4.8 Suponha que B(n,p) represente uma va- 


riável aleatória binomial com parâmetros 
ne p. Mostre que 


P(B(n,p)<=ij=1-P(B(n1l-p)sn-i-t1) 


4.9 


4.10 


4.11 


Dica: O número de sucessos menor ou 
igual a i é equivalente a que informação a 
respeito do número de fracassos? 

Se X é uma variável aleatória binomial 
com valor esperado 6 e variância 2,4, de- 
termine P(X = 5). 

Uma urna contém n bolas numeradas de 1 
an. Se você retira m bolas aleatoriamente 
e em sequência, cada vez recolocando a 
bola selecionada de volta na urna, deter- 
mine P(X = k),k = 1,...,m, onde X é o nú- 
mero máximo dos m números escolhidos. 
Dica: Primeiro obtenha P(X = k). 

Os times A e B jogam uma série de parti- 
das. O time vencedor é aquele que ganhar 
primeiro 3 partidas. Suponha que o time 
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A vença cada partida, independentemen- 

te, com probabilidade p. Determine a 

probabilidade condicional de que o time 

A vença 

(a) a série dado que ele tenha ganho a 
primeira partida; 

(b) a primeira partida dado que ele vença 
a série. 


4.12 Um time local de futebol ainda precisa jo- 


gar mais 5 partidas. Se ele ganhar o jogo 
do final de semana, então ele jogará os 
seus 4 jogos finais no grupo mais difícil de 
sua liga, e se perder, jogará seus jogos fi- 
nais no grupo mais fácil. Se jogar no grupo 
mais difícil, o time terá probabilidade de 
0,4 de ganhar os jogos, e se jogar no gru- 
po mais fácil essa probabilidade aumenta 
para 0,7 Se a probabilidade do time ven- 
cer o jogo deste final de semana é de 0,5, 
qual é a probabilidade de que ele vença 
pelo menos 3 de seus 4 jogos finais? 


4.13 Cada um dos membros de um corpo de 


7 jurados toma uma decisão correta com 
probabilidade de 0,7 de forma indepen- 
dente uns dos outros. Se a decisão do 
corpo de jurados é feita pela regra da 
maioria, qual é a probabilidade de que a 
decisão correta seja tomada? Dado que 4 
juízes tenham a mesma opinião, qual é a 
probabilidade de que o corpo de jurados 
tenha tomado a decisão correta? 

Em média, 5,2 furacões atingem deter- 
minada região em um ano. Qual é a pro- 
babilidade de haver 3 furacões ou menos 
atingindo-a neste ano? 


4.15 O número de ovos deixado em uma árvore 


por um inseto de certo tipo é uma variável 
aleatória de Poisson com parâmetro À. En- 
tretanto, tal variável aleatória só pode ser 
observada se for positiva, já que se ela for 
igual a O não podemos saber se tal inseto 
pousou na folha ou não. Se Y representa o 
número de ovos depositados, então 


PWy=j=PX=iX>0) 


onde X é Poisson com parâmetro À. De- 
termine E[Y]. 


4.16 Cada um de n garotos e n garotas, inde- 


pendentemente e aleatoriamente, esco- 
lhe um membro do sexo oposto. Se um 
garoto e uma garota se escolherem, eles 
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formam um casal. Numere as garotas e 

suponha que G, seja o evento em que a 

garota número i faça parte de um casal, 

Seja P, = 1 — P(UZ Gi) a probabilidade 

de que nenhum casal seja formado. 

(a) Determine P(G)). 

(b) Determine P(G|G,) 

(c) Obtenha uma aproximação para P, se 
n é grande. 

(d) Obtenha uma aproximação para P,, 
a probabilidade de que exatamente k 
casais sejam formados, se n é grande. 

(e) Use a identidade inclusão-exclusão 
para avaliar P,. 

4.17 Um total de 2n pessoas, formado por n 
casais, é dividido em n pares. Numere as 
mulheres arbitrariamente e suponha que 
W;represente o evento em que a mulher i 
forma um par com seu marido. 

(a) Determine P(W,). 

(b) Para i < j, determine P(W|W,) 

(c) Obtenha uma aproximação para a 
probabilidade de que nenhuma mu- 
lher forme um par com seu marido se 
n é grande. 

(d) Se cada par deve ser formado por um 
homem e uma mulher, a que o proble- 
ma se reduz? 

4.18 Uma cliente de um cassino continuará a fa- 
zer apostas de R$5,00 no vermelho de uma 
roleta até que ela ganhe 4 dessas apostas. 
(a) Qual é a probabilidade de que ela 

faça um total de 9 apostas? 

(b) Qual será o seu número esperado de 
vitórias quando ela parar? 

Observação: Em cada aposta, ela ganha 

R$5,00 com probabilidade 4 ou perde 


R$5,00 com probabilidade 38. 

4.19 Quando três amigos tomam café, eles de- 
cidem quem paga a conta jogando cada 
um deles uma moeda. Aquele que obtiver 
um resultado diferente dos demais paga 
a conta. Se todas as três jogadas produ- 
zirem o mesmo resultado, então uma se- 
gunda rodada de jogadas é feita, e assim 
por diante até que alguém obtenha um 
resultado diferente dos demais. Qual é a 
probabilidade de que: 

(a) exatamente 3 rodadas sejam feitas. 
(b) mais que 4 rodadas sejam necessárias. 

4.20 Mostre que, se X é uma variável aleatória 

hipergeométrica com parâmetro p, então 


—plog(p) 


ENl/X]= 55 5 


Dica: Você precisará avaliar uma expres- 
La) % 
são da forma >) a'/i. Para fazer isso, escre- 
i=1 
vag'ji = fo x! dx,e então faça uma troca 
entre a soma e a integral. 
4.21 Suponha que 


PiX=ag=pPX=b)=1-p 


(a) Mostre que 42 é uma variável alea- 


tória de Bernoulli. 
(b) Determine Var(X). 
4.22 Cada partida que você joga resulta em 
vitória com probabilidade p. Você plane- 
ja jogar 5 partidas, mas se você vencer a 
quinta partida, então você precisará con- 
tinuar a jogar até perder. 
(a) Determine o número esperado de 
partidas que você jogará. 
(b) Determine o número esperado de 
partidas que você perderá. 
4.23 Bolas são retiradas aleatoriamente, uma 
de cada vez e sem reposição, de uma urna 
que tem inicialmente N bolas brancas e 
M bolas pretas. Determine a probabilida- 
de de que n bolas brancas sejam retiradas 
antes de m bolas pretas, n=N,m =<M. 
4.24 Dez bolas devem ser distribuídas entre 5 
urnas, com cada bola indo para a urna i 
com probabilidade p, 52 ,p; = Seja X, 
o número de bolas que vão para a urna i. 
Suponha que os eventos correspondentes 
às localizações das diferentes bolas sejam 
independentes. 
(a) Que tipo de variável aleatória é X? 
Seja tão específico quanto possível. 
(b) Para i  j, que tipo de variável aleató- 
na é X + A? 
(c) Determine P(X,+ X, + X, =7) 
4.25 No problema do pareamento (Exemplo 
5m no Capítulo 2), determine: 
(a) o número esperado de pareamentos. 
(b) a variância do número de pareamentos. 
4.26 Seja a a probabilidade de que uma variá- 
vel aleatória X com parâmetro p seja um 
número par. 
(a) Determine « usando a identidade « = 
Dê PlX=2i). 
(b) Determine a condicionando entre X 
=louX>1. 
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INTRODUÇÃO 


No Capítulo 4, consideramos variáveis aleatórias discretas — isto é, variáveis 
aleatórias cujo conjunto de valores possíveis é finito ou contavelmente infinito. 
Entretanto, também existem variáveis aleatórias cujo conjunto de valores pos- 
síveis é incontável. Dois exemplos são a hora de chegada de um trem em uma 
determinada estação e o tempo de vida de um transistor. Dizemos que X é uma 
variável aleatória contínua* se existir uma função não negativa f, definida para 
todo real x E (0,0), que tenha a propriedade de que, para qualquer conjunto 
B de números reais,** 


P(X e B])= fico dx (11) 


A função f é chamada de função densidade de probabilidade da variável alea- 
tória X (veja a Figura 5.1). 


* As vezes chamada de absolutamente contínua. 
** Na realidade, por razões técnicas, a Equação (1.1) é verdadeira apenas para os conjuntos 
mensuráveis de B, que, felizmente, incluem todos os conjuntos de interesse prático. 
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do b 
P(a=<X< b)= área da região sombreada 


Figura 5.1 Função densidade de probabilidade f. 


Colocando em palavras, a Equação (1.1) diz que a probabilidade de que X 
esteja em B pode ser obtida integrando-se a função densidade de probabilidade 
ao longo do conjunto B. Como X deve assumir algum valor, f deve satisfazer 


1=P(X € (-00,00)) = f. fo) dx 


Tudo o que se deseja saber sobre X pode ser respondido em termos de f. Por 
exemplo, da Equação (1.1), fazendo B = [a, b], obtemos 


b 
Pla=X <b) E fl) dx (1.2) 


Se fizermos a = b, obtemos 
a 
P(X =a) =| fl) dx =0 
a 


Colocando em palavras, essa equação diz que a probabilidade de que uma va- 
riável aleatória contínua assuma qualquer valor específico é zero. Portanto, 
para uma variável aleatória contínua, 


P(X < a=PW Sa =Fo= f(x) dx 


Exemplo 1a 


Suponha que X seja uma variável aleatória contínua cuja função densidade de 
probabilidade é dada por 


=] cg 2?) 0<x<2 
fO) = E caso contrário 


(a) Qual é o valor de C? 
(b) Determine P[X > 1). 
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Solução (a) Como f é a função densidade de probabilidade, devemos ter 
[Sof (0) dx = 1,0 que implica 


2 
À (4x — 2X) dx=1 
0 


ou 
3 x=2 
C Ei — | = 1 
x=0 
ou 
3 
c = 8 
Portanto, 
(b) PIX > = fr = à ficar — W)dx=3 a 
Exemplo 1b 


A quantidade de tempo em horas que um computador funciona sem estragar é 
uma variável aleatória contínua com função densidade de probabilidade 


Jr AO 4 =0 
ro= |) as 


Qual é a probabilidade de que 


(a) o computador funcione entre 50 e 150 horas antes de estragar? 
(b) ele funcione menos de 100 horas? 


Solução (a) Como 
o [o.0) 
1 a fegds=a [ e */100 dy 
—oo 0 
obtemos 


1 
E —x/100/00 — 
1=—A(100)e PS = 100) ou A= TT 
Portanto, a probabilidade de que um computador funcione entre 50 e 150 horas 
antes de estragar é dada por 


150 
P(5O < X < 150)= f À q-sn100 q sapato 
so 100 50 


=e 12 63 a 0,384 


(b) Similarmente, 


100 1 
P(X 100) — — e X/100 q, — — p—*/100 100 te gia 
PRI j 100 eo en 0,633 
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Em outras palavras, em aproximadamente 63,3% das vezes um computador 
estragará antes de 100 horas de uso. = 


Exemplo 1c 


O tempo de vida, em horas, de uma válvula de rádio é uma variável aleatória 
com função densidade de probabilidade dada por 


O x=100 


f(x) = 4 100 
— 


100 
x? á 


Qual é a probabilidade de que exatamente 2 de 5 válvulas no circuito de um 
aparelho de rádio tenham que ser trocadas nas primeiras 150 horas de opera- 
ção? Suponha que os eventos E, i = 1,2,3,4,5, em que a i-ésima válvula tem 
que ser substituída dentro deste intervalo de tempo sejam independentes. 


Solução Do enunciado do problema, temos 


150 
P(Ei) = fO) dx 
0 


Portanto, da independência dos eventos E, tem-se que a probabilidade dese- 


jada é 
) a! 27.80 
ZJla) Na) Da = 


A relação entre a função distribuição cumulativa Fe a função densidade de 
probabilidade fé dada por 


a 
F(a) = P(X e (-oo,a]) = Á f(x) dx 
—00 
Derivando ambos os lados da última equação, temos 
d 
Ea (a) = f(a) 
a 


Isto é, a função densidade de probabilidade é a derivada da função distribuição 
cumulativa. Uma interpretação um pouco mais intuitiva da função densidade 
pode ser obtida a partir da Equação (1.2) como segue: 


= £ a+e/2 
Pja-jsxsa+5=[ FO) dx = efta) 
2 2 a-—e/2 


-e/ 


quando £ é pequeno e f(-) é contínua em x = a. Em outras palavras, a probabi- 
lidade de que a variável aleatória X esteja contida em um intervalo de extensão 
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£ em torno do ponto a é de aproximadamente «f(a). A partir desse resultado, 
vemos que f(a) é uma medida de quão provável é a presença da variável alea- 
tória na vizinhança de a. 


Exemplo 1d 
Se X é contínua com função distribuição F, e função densidade f,, determine a 
função densidade de Y = 2X. 
Solução Vamos determinar f, de duas maneiras. A primeira maneira é dedu- 
zir, e depois derivar, a função distribuição de Y: 
Fy(a)=PlY <a) 

=P2X <a) 

=P(X < a/2) 

= Fy(a/2) 


A derivada dessa função é 
1 
fr(a) = >fx(a/2) 


Outra maneira de determinar f, é observar que 


fra) = Pla - CÍ <y <a, É 


= Sfx(a/?) 


Dividindo por £, obtemos o mesmo resultado anterior. E 


5.2 ESPERANÇA E VARIÂNCIA DE VARIÁVEIS 
ALEATÓRIAS CONTÍNUAS 


No Capítulo 4, definimos o valor esperado de uma variável aleatória discreta 
X como 


EX]=5> xPlX =>) 


Se X é uma variável aleatória contínua com função densidade de probabilidade 
f(x), então, como 


fo)dx=Px=X=sx+ dx) para dx pequeno 


é fácil mostrar que é análogo definir o valor esperado de X como 


E(X] = f. xf(x0) dx 
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Exemplo 2a 
Determine E[X] quando a função densidade de X é 


2x se 0O<x=<l 
O caso contrário 


fo) = 


Solução 
E(X] = fato dx 
= 2x? dx 
0 
a 
Exemplo 2b 
A função densidade de X é dada por 


1se0=xy=<1l 
fo = | O caso contrário 


Determine Efe”). 


Solução Seja Y = e”. Começamos determinando F,, a função distribuição de 
probabilidade de Y. Agora, paral <x = e, 


Fr) =P(Y <a) 
= P(e* < x) 
= P(X = log(x)) 


log(x) 
-[ os 


= log(x) 


Derivando F,(x), podemos concluir que a função densidade de probabilidade 
de Y é dada por 


1 
fr(09) = — l<x=e 
x 
Portanto, 


Efe] =EprI= [" afyo)de 


e 
- | ds 
1 


=e-1 [| 
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Embora o método empregado no Exemplo 2b para calcular o valor espe- 
rado de uma função de X seja sempre aplicável, existe, como no caso discreto, 
uma maneira alternativa de se proceder. A seguir, temos uma analogia direta 
da Proposição 4.1 do Capítulo 4. 


Proposição 2.1 Se X é uma variável aleatória contínua com função densidade 
de probabilidade f(x), então, para qualquer função de valor real g, 


Elg0OO] = É 80)f (0) dx 


—00 


A aplicação da Proposição 2.1 no Exemplo 2b resulta em 


1 
Ele]= [ eds jáquef()=1, 0<x<1 
0 
=e-1 


o que concorda com o resultado obtido naquele exemplo. 

A demonstração da Proposição 2.1 é mais envolvente do que aquela de seu 
análogo para variáveis aleatórias discretas. Vamos apresentar esta prova con- 
siderando que a variável aleatória g(X) é não negativa (a demonstração geral, 
que se segue o argumento que apresentamos, é indicada nos Exercícios Teóri- 
cos 5.2 e 5.3). Precisaremos do lema a seguir, que é de interesse independente. 


Lema 2.1 


Para uma variável aleatória não negativa Y, 
oo 
E[Y] = / P(Y > yjdy 
0 


Demonstração Apresentamos uma demonstração para o caso em que Y 
é uma variável aleatória contínua com função densidade de probabilidade 


fy Temos 
[rr-no=[ [ poda 
0 0 Jy 


onde usamos o fato de que P(Y > y) = a fy (0) dx. Trocando a ordem de 
integração na equação anterior, obtemos 


per>na= [O (/ dy) frias 


= [astro dx 
= E(Y] E 
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Demonstração da Proposição 2.1 Do Lema 2.1, para qualquer função g para 
a qual g(x) > 0, 


Ego] = / P(gUO > yJdy 


o 
=[ [o fodray 
0 x:g(0)>y 
800) 
= / / dy f(x) dx 
x:g(x)>0 JO 


= A g0)f (0) dx 
x:g(x)>0 


o que completa a demonstração. 


Exemplo 2c 


Uma vareta de comprimento 1 é dividida em um ponto U que é uniformemente 
distribuído ao longo do intervalo (0, 1). Determine o comprimento esperado do 
pedaço que contém ponto p, 0=p=<1. 


Solução Seja L(U) o tamanho do pedaço da vareta que contém o ponto p, e 
note que 


I-UU<op 
Lt) = [ty U>p 


(Veja a Figura 5.2.) Com isso, da Proposição 2.1, 


1 
EILp(U)] -[ Lp(u) du 


Já que p(1 — p) é maximizado quando p = 1/2, é interessante notar que o com- 
primento esperado do pedaço da vareta que contém o ponto p é maximizado 
quando p está no ponto central da vareta original. n 


«— 1-U > 
MM 
E q 


E e É 5) 
0 p U 70 


Figura 5.2 Pedaço da vareta contendo o ponto p: () U <p; (b) U > p. 
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Exemplo 2d 

Suponha que se você estiver adiantado s minutos para um compromisso, então 
você tem que arcar com o custo cs. Do contrário, se estiver atrasado s minutos, 
você incorre no custo ks. Suponha também que o tempo de viagem de onde 
você está no momento para o local de seu compromisso é uma variável aleató- 
ria contínua com função densidade de probabilidade f. Determine o momento 
em que você deve sair se você quiser minimizar o seu custo esperado. 


Solução Seja X o tempo de viagem. Se você sair t minutos antes de seu com- 
promisso, então seu custo — chame-o de C(X) — é dado por 

Jdt- NX) seX=<=t 
co = [x — )seX=t 


Portanto, 


EICOO] = k CHF) dx 


t (0,0) 
RA c(t — f(x) dx + / k(x — Df(x) dx 
0 


t 


t t [9,0] [6,0] 
= [ fl) dx — e [ xf(x) dx + k [ xf(x) dx — 7) f(x) dx 
0 0 t t 


O valor de t que minimiza E[C(X)] pode agora ser obtido com o auxílio da 
disciplina de cálculo. Derivando, obtemos 


SE(COO] =ectf(t) + cF(t) — cf) — ktft) + kfi) — KU — F(b] 
=(k+ OF) — k 


Igualando o lado direito a zero, vemos que o custo mínimo esperado é obtido 
quando você sai t* minutos antes de seu compromisso, onde t* satisfaz a 


k 
Ft) = —— 
a) k+c [il 


Como no Capítulo 4, podemos usar a Proposição 2.1 para mostrar o seguinte. 


Corolário 2.1 Seaebsão constantes, então 
E[aX + b]=aE(X] + b 


A prova do Corolário 2.1 para uma variável aleatória contínua é igual àquela 
dada para uma variável aleatória discreta. A única mudança é que a soma é 
trocada por uma integral e a função de probabilidade é trocada por uma função 
densidade de probabilidade. 

A variância de uma variável aleatória contínua é definida de forma exa- 
tamente igual à de uma variável aleatória discreta. Isto é, se X é uma variável 
aleatória com valor esperado u, então a variância de X é definida (para qual- 
quer tipo de variável aleatória) como 


Var(X) = EI(X — n)'] 
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A fórmula alternativa 


Var(X) = E[X'] - (E[X]? 


é estabelecida de maneira similar à sua contrapartida no caso discreto. 


Exemplo 2e 
Determine Var(X) para a variável aleatória X do Exemplo 2a. 


Solução Primeiro computamos E[X”]. 


EX = / o xf(x) dx 


Com isso, como E[X] = 2/3, obtemos 


2 
Var(X) = Es (5) = E 


Pode-se mostrar que, para a e b constantes, 
Var(aX + b) = àºVar(X) 


A demonstração imita aquela dada para variáveis aleatórias discretas. 


Existem várias classes importantes de variáveis aleatórias contínuas que 
aparecem frequentemente em aplicações de probabilidade; as próximas seções 


são dedicadas ao estudo de algumas delas. 


5.3 A VARIÁVEL ALEATÓRIA UNIFORME 


Diz-se que uma variável aleatória é distribuída uniformemente ao longo do 


intervalo (0, 1) se a sua função densidade de probabilidade é dada por 


1 0<x<1l 
fo) = | O caso contrário 


Note que a Equação (3.1) é uma função densidade de probabilidade, já que 
fo) =0e fo)dx = fo dx = 1. Como f(x) > O somente quando x E (0, 
1), tem-se como consequência que X deve assumir um valor no intervalo (0,1). 
Também, como f(x) é constante para x E (0,1), X tem a mesma probabilidade 
de estar na vizinhança de qualquer valor em (0, 1). Para verificar essa afirma- 


ção, observe que, para) <a<b<l, 


b 
PlasX=by= [ fo)dx=b-— a 
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Fa) F(a) 
1 


(a) (b) 


Figura 5.3 Gráfico de (a) fa) e (b) F(a) para uma variável aleatória uniforme (a, B). 


Em outras palavras, a probabilidade de que X esteja em qualquer subintervalo 
particular de (0, 1) é igual ao comprimento desse subintervalo. 

Em geral, dizemos que X é uma variável aleatória uniforme no intervalo 
(a, B) se a função densidade de probabilidade de X é dada por 


1 
fw = RE seu <x<B 


0 caso contrário 


(3.2) 


Como F(a) = É Av f(x) dx, decorre da Equação (3.2) que a função distribuição 
de uma variável aleatória uniforme no intervalo (a, 8) é dada por 


0 a<a 


F(a) = 


a — 
a<a<B 
Bos 
1 azB 
A Figura 5.3 apresenta um gráfico de f(a) e F(a). 


Exemplo 3a 


Suponha que a variável aleatória X esteja uniformemente distribuída ao longo 
. de (a, B). Determine (a) E[X] e (b) Var(X). 


Solução (a) 
E(X] = mm xf(x) dx 


B x 
-[ 52d 
pº — o? 
“2U8-0) 
.B+ra 


2 
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Colocando em palavras, o valor esperado de uma variável aleatória uniforme- 
mente distribuída ao longo de algum intervalo é igual ao ponto central desse 
intervalo. 


(b) Para determinar Var(X), primeiro calculamos E[X”). 


B 
Ep] = [ 3 E =x" dx 


B? = a? 
“3B-0) 
» B? + ab + a? 
o 3 
Com isso, 
2 2 2 
Var(X) — Br + ab + a” e, (a + BJ 
3 4 
2 B- a? 
2 


Portanto, a variância de uma variável aleatória uniformemente distribuída ao 
longo de algum intervalo é igual ao quadrado do comprimento daquele inter- 
valo dividido por 12. E 


ue 


Exemplo 3b 


Se a variável aleatória X é uniformemente distribuída ao longo de (0, 10), cal- 
cule a probabilidade de que (3) X <3,(bD) X >6e(c)3<X<s8. 


3 
1 
Solução (a) P(X < 3)= : nd= 
10 1 4 
0) PX>6=[ qu= 
(o) PB <X<8) eos E E 
< = br = — 
3 10 2 
Exemplo 3c 


Ônibus chegam em uma determinada parada em intervalos de 15 minutos co- 
meçando às 7:00. Isto é, eles chegam às 7:00, 7:15, 7:30, 7:45, e assim por diante. 
Se um passageiro chega na parada em um instante de tempo que é uniforme- 
mente distribuído entre 7:00 e 7:30, determine a probabilidade de que ele es- 
pere 


(a) menos que 5 minutos por um ônibus; 
(b) mais de 10 minutos por um ônibus. 


Solução Suponha que X represente o número de minutos após as 7:00 em 
que o passageiro chega na parada. Como X é uma variável aleatória uniforme 
ao longo do intervalo (0, 30), tem-se que o passageiro terá que esperar menos 
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que 5 minutos se (e somente se) ele chegar entre 7:10 e 7:15 ou entre 7:25 e 7:30. 
Com isso, a probabilidade desejada para a letra (a) é 


15 30 4 1 
= — — dx= — 
PIO <X <15S)+ PDS <X<õ30) A qu + 30 x 3 


Similarmente, ele teria que esperar mais de 10 minutos se ele chegasse entre 
7:00 e 7:05 ou entre 7:15 e 7:20, e a probabilidade desejada para a letra (b) é 


1 
RIO =X e sb AO = 4 e dij= s m 


O próximo exemplo foi considerado pela primeira vez pelo matemático 
francês Joseph L. F. Bertrand em 1889 e é frequentemente chamado de para- 
doxo de Bertrand. Ele representa nossa introdução a um assunto comumente 
chamado de probabilidade geométrica. 


Exemplo 3d 


Considere uma corda aleatória de um círculo. Qual é a probabilidade de que o 
comprimento da corda seja maior do que o lado do triângulo equilátero inscri- 
to nesse círculo? 


Solução Na forma em que está enunciado, não há como resolver esse pro- 
blema porque não está claro o que se quer dizer por corda aleatória. Para 
dar sentido a essa frase, vamos reformular o problema de duas maneiras 
distintas. 

A primeira formulação é a seguinte: a posição da corda pode ser deter- 
minada por sua distância em relação ao centro do círculo. Essa distância deve 
estar entre 0 e r,o raio do círculo. Agora, o comprimento da corda será maior 
do que o lado do triângulo equilátero inscrito no círculo se a distância da corda 
para o centro do círculo for menor que r/2. Com isso, supondo que uma corda 
aleatória seja uma corda cuja distância D até o centro do círculo esteja unifor- 
memente distribuída entre O e r, vemos que a probabilidade de que o compri- 
mento da corda seja maior do que o lado do triângulo inscrito é 


rpp<jj-Eo; 


r 2 


Para nossa segunda formulação do problema, considere uma corda arbi- 
trária do círculo; em uma das extremidades da corda, desenhe uma tangente. O 
ângulo 9 entre a corda e a tangente, que pode variar entre O e 180º, determina a 
posição da corda (veja a Figura 5.4). Além disso, o comprimento da corda será 
maior que o lado do triângulo equilátero inscrito se o ângulo 6 estiver entre 60º 
e 120º. Portanto, supondo que uma corda aleatória seja uma corda cujo ângulo 
9 esteja uniformemente distribuído entre 0º e 180º, vemos que a resposta dese- 
jada a partir desta formulação é 

120 —- 60 1 


a CURE O Ra TOR 
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Figura 5.4 


Note que experimentos aleatórios podem ser realizados de tal forma que 1/2 
ou 1/3 sejam a probabilidade correta. Por exemplo, se um disco circular de raio 
r fosse jogado em uma tábua graduada com linhas paralelas separadas por uma 
distância 2r, então uma e apenas uma dessas linhas atravessaria o disco e for- 
maria uma corda. Todas as distâncias dessa corda até o centro do disco têm a 
mesma probabilidade de ocorrer, de forma que a probabilidade desejada de 
que o comprimento da corda seja maior do que o lado de um triângulo equilá- 
tero inscrito é igual a 1/2. Em contraste, se o experimento consistisse em fazer 
girar uma agulha livremente em torno do ponto A na borda do círculo (veja a 
Figura 5.4), a resposta desejada seria 1/3. E 


5.4 VARIÁVEIS ALEATÓRIAS NORMAIS 


Dizemos que X é uma variável aleatória normal, ou simplesmente que X é 
normalmente distribuída, com parâmetros u e o,se a função densidade de X 


é dada por 
1 2/02 
fQ) = —=>— e Sr Po — 00 <x<o 
210 
A função densidade é uma curva em forma de sino simétrica em relação a qu 
(veja a Figura 5.5). 


A distribuição normal foi introduzida pelo matemático francês Abraham 
DeMoivre em 1733, que a utilizou para obter aproximações probabilísticas as- 
sociadas a variáveis aleatórias binomiais com parâmetro n grande. Esse resul- 
tado foi mais tarde estendido por Laplace e outros e hoje está incorporado em 
um teorema probabilístico conhecido como o teorema do limite central, que é 
discutido no Capítulo 8. O teorema do limite central, um dos dois resultados 
mais importantes na teoria da probabilidade*, fornece uma base teórica para 
a observação empírica frequentemente notada de que, na prática, muitos fenô- 
menos aleatórios obedecem, pelo menos aproximadamente, a uma distribui- 
ção de probabilidade normal. Alguns exemplos de fenômenos aleatórios que 


* A outra é a lei forte dos grandes números. 
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0,399 


u—2o u u+ 20 


(b) 


Figura 5.5 Função densidade de probabilidade normal: (a) uy = 0,0 =1;(b)ue 
o arbitrários. 


seguem esse comportamento são a altura de um homem, a velocidade de uma 
molécula de gás em qualquer direção, e o erro cometido na medição de uma 
grandeza física. 

Para provar que f(x) é de fato uma função densidade de probabilidade, 
precisamos mostrar que 


1 
2x0 


Fazendo a substituição y = (x — u)/o, vemos que 


l / Coop yra 
dE ds Sapos 


Com isso, precisamos mostrar que 


/ er dy = "2x 


—00 


do emo q —1 
—00 


Com esse objetivo, considere 1 = [. e dy. Então, 


P= E era [o e dx 


—00 —00 


= f. E e dy dx 
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Avaliamos agora a integral dupla por meio de uma mudança de variáveis 
para coordenadas polares (isto é, x = r cos 0,y = rsen 0,e dy dx = r d dr). 


Assim, 
oo plr R 
P=[ ) eT rdo dr 
0 0 


[0,0] 
=27 [ re” dr 
0 


= -2me "PI 


= 2x 


Com isso, 1 = 2x e o resultado está demonstrado. 

Um importante fato a respeito de variáveis aleatórias normais é que se X é 
uma variável aleatória normalmente distribuída com parâmetros qu e o”, então 
Y = aX + b é normalmente distribuída com parâmetros au + b e ao”. Para 
provar essa afirmação, suponha que a > O (a demonstração para a < O é simi- 
lar). Seja F, a função distribuição cumulativa de Y. Então, 


Fy() = P(Y < 2) 


=P(aX + b=x) 
apps 
= 
= Fx) 
a 


onde F, é a função distribuição cumulativa de X. Calculando a derivada, a fun- 
ção densidade de Y é então 


x-—b 
a 


— b 
exp — 2/20?) 


1 
frQ) = 214( ) 


1 
= 2740 


1 
ES expl-(x — b — au)? /2a0)?) 


o que mostra que Y é normal com parâmetros au + be do”. 

Uma implicação importante do resultado anterior é que se X é normal- 
mente distribuída com parâmetros q e o”, então Z = (X — u)/o é normalmente 
distribuída com parâmetros Q e 1. Tal variável aleatória é chamada de variável 
aleatória normal padrão ou unitária. 

Mostramos agora que os parâmetros u e o” de uma variável aleatória nor- 
mal representam, respectivamente, o seu valor esperado e a sua variância. 


Exemplo 4a 


Determine E[X] e Var(X) quando X é uma variável aleatória normal com pa- 
râmetros yu e o”. 


Capítulo 5 e Variáveis Aleatórias Contínuas 247 


Solução Vamos começar determinando a média e a variância de uma variável 


aleatória normal padrão Z = (X — u)/o. Temos 
oo 
ElZ]= [ xfrcas 


bee 2 
=—— xe“ dx 


Assim, 
Var(Z) = E[Z?] 


= a É Ze dx 
27 —00 


Integrando por partes (com u = xe dv = xe?! 2), obtemos 


l —x2/2 00 Er —x2/2 
Var(Z) = — (—xe lEso + e dx) 
—00 


V2a 
1 Ds id 
— —x*/2 
= e dx 
27 J-o 


=1 
Como X = yu + oZ, temos como resultados 


HM =u + oElZ]=u 


Var(X) = 0 Var(Z) = o” 


E costumeiro representar a função distribuição cumulativa de uma variável 


aleatória normal padrão como (x). Isto é, 


1 x “np 
== [Pa 
—00 


Os valores de P(x) para x não negativo são dados na Tabela 5.1. Para valores 


negativos de x, o valor de D(x) pode ser obtido a partir da relação 


d(-x)=1 — d(x) — 00 <X<0O 


(4.1) 


A demonstração da Equação (4.1), que resulta da simetria da função densida- 
de normal padrão, é deixada como exercício. Essa equação diz que se Z é uma 


variável aleatória normal padrão, então 


P(Z=-)=P(Z > x) — 00 <X<0 
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Tabela 5.1 Área Px) sob a curva normal padrão à esquerda de x 
X 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 


0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359 
0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753 
0,2 0,5793 0,5832 0,587] 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141 
0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517 
0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879 
0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224 
0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549 
0,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852 
0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133 
0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389 
1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621 
1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830 
1,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,9015 
1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177 
1,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,92922 0,9306 0,9319 
1,5 0,93322 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441 
1,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545 
17 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633 
1,8 0,9641 0,9649 0,9656 0,9664 0,967] 0,9678 0,9686 0,9693 0,9699 0,9706 
19 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,9767 
20 0,977 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,9817 
21 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,9857 
22 0,9861 0,9864 0,9868 0,987] 0,9875 09878 0,9881 0,9884 0,9887 0,9890 
2,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,9916 
24 0,9918 0,9920 0,992 0,9925 0,9927 0,9929 0,9931 0,99322 0,9934 0,9936 
25 0,9938 0,9940 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,9952 
2,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9962 0,9963 0,9964 
27 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0,9972 0,9973 0,9974 
28 09974 0,9975 0,9976 09977 0,997 0,9978 0,9979 0,9979 0,9980 0,9981 
29 09981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,9986 
30 0,9987 0,9987 0,9987 0,9988 0,9988 0,9989 0,9989 0,9989 0,9990 0,9990 
3,1 0,9990 0,9991 0,999] 0,9991 0,99922 0,9992 0,9992 0,9992 0,9993 0,9993 
32 0,9993 0,9993 0,9994 0,9994 09994 0,9994 0,9994 0,9995 0,9995 0,9995 
33 0,9995 0,9995 0,9995 0,9996 09996 0,9996 0,9996 0,9996 0,9996 0,9997 
34 0,9997 0,9997 0,9997 0,9997 0,99977 09997 0,99977 0,9997 0,9997 0,9998 


Como Z = (X — u)/o é uma variável aleatória normal padrão sempre que X é 
normalmente distribuída com parâmetros q e o”, tem-se que a função distribui- 
ção de X pode ser escrita como 


Pela) = Px sa)=P(EDt = E) o(Et) 
o o o 


Exemplo 4b 


Se X é uma variável aleatória normal com parâmetros yu = 3e o” = 9, determi- 
ne(a)P2<X<S5);(b) PX>0);(c) PIIX — 3| > 6). 
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Solução (a) 


Ne Ne” | 
| 
o 
| 
pm 
eine 


E (5 
Ele 1-6 (1) | «03779 
(3) -[i-*(]-o 
(b) 
px > qj=p[ESÊ > sie = piz > 
=1-— 4(-1) 
= (1) 
= 0,8413 
(c) 


P(IX —-3>60=P(X>9+P(X<õ—3) 
ape pa 
=P(Z>2)+4 P(Z<- 
=1— 4(2) + P(-2) 
=2[1 — 62] 
= 0,0456 La 


Exemplo 4c 


Uma prova é frequentemente considerada boa (no sentido de determinar uma 
dispersão de conceitos válida para aqueles que os recebem) se as notas daque- 
les que a fizeram puderem ser aproximadas por uma função densidade normal 
(em outras palavras, um gráfico da frequência das notas dos alunos deve ter 
aproximadamente a forma de sino observada na função densidade de proba- 
bilidade normal). O professor utiliza com frequência as notas dos alunos para 
estimar os parâmetros normais q e o” e então atribuir o conceito A para aque- 
les cujas notas forem maiores que gu + o, B para aqueles cujas notas estiverem 
entre ge u + o,€C para aqueles cujas notas estiverem entre py — c e qu, D para 
aqueles cujas notas estiverem entre y — 20 e yu — o, E para aqueles com notas 
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abaixo de qu — 20 (essa estratégia é às vezes chamada “de dar o conceito com 
base na curva”). Como 


—u 


PM > u+oj=P(É > 1|=1- 00) = 01587 


— 


Pu<X<utoj=Pjo < É < 1] =0(1) — (0) = 03413 


* «0] 


= 90) — O(-1) = 0,3413 


X 
Pfu — o <x<m=P([- < 


X -— 
Pu -20 <X<u-a)=P[-2< DE cm 
Foi 


= 902) — d(1) = 0,1359 
— 


PIX < yu — 20) -p (É < 2] = P(-2) = 0,0228 


tem-se que aproximadamente 16% da classe receberão um conceito A na pro- 
va, 34% um conceito B, 34% um conceito € e 14% um conceito D; 2% serão 
reprovados. E 


Exemplo 4d 


Um perito utilizado em um julgamento de paternidade testifica que a extensão 
(em dias) da gestação humana é normalmente distribuída com parâmetros pu 
=270e o” = 100.0 réu é capaz de provar que estava fora do país durante um 
período que começou 290 dias antes do nascimento da criança e terminou 240 
dias depois do nascimento. Se o réu é, de fato, o pai da criança, qual é a pro- 
babilidade de que a mãe possa ter tido a gestação muito longa ou muito curta 
indicada pela testemunha? 


Solução Seja Xa extensão da gestação e suponha que o réu é o pai. Então a pro- 
babilidade de que o nascimento pudesse ocorrer dentro do período indicado é 


. 
P(X > 2900u X < 240) =P(X > 290) + P(X < 240) 
X — 20 X— 20 
=1="00) 4 1=00) 
= 0,0241 E 


Exemplo 4e 


Suponha que uma mensagem binária, formada por 0ºs e 1's, deva ser transmiti- 
da por fio do ponto A para o ponto B. Entretanto, dados enviados por fio estão 
sujeitos a ruídos de canal. Para reduzir-se a possibilidade de erro, o valor 2 é 
enviado quando a mensagem é 1,e o valor —2 é enviado quando a mensagem 
é 0.Sex,x = +2,é o valor enviado a partir do ponto 4, então R,o valor rece- 
bido no ponto B, é dado por R = x + N, onde N é o ruído de canal. Quando a 
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mensagem é recebida no ponto B,o receptor decodifica a mensagem de acordo 
com a regra a seguir: 


Se R = 0,5, então conclui-se que 1 foi enviado. 
Se R < 0,5, então conclui-se que O foi enviado. 


Como o ruído de canal é, com frequência, normalmente distribuído, vamos de- 
terminar as probabilidades de erro quando N é uma variável aleatória normal 
padrão. 

Dois tipos de erro podem ocorrer: um é que a mensagem 1 seja incorreta- 
mente identificada como sendo 0, e o outro é que o O possa ser incorretamente 
identificado como 1. O primeiro tipo de erro ocorre se mensagem for 1e 2 + 
N < 0,5, enquanto o segundo erro ocorre se a mensagem for0e 2 + N > 0,5. 
Com isso, 


Plerrolmensagem é 1) = PIN < —1,5) 
=1 — d(1,5) = 0,0668 


Plerrojmensagem é 0) = P(N = 2,5) 
= 1 - 0,5) = 0,0062 E 


5.4.1 A aproximação normal para a distribuição binomial 


Um importante resultado na teoria da probabilidade, conhecido como o teorema 
limite de DeMoivre-Laplace, diz que, quando n é grande, uma variável aleatória 
binomial com parâmetros n e p tem aproximadamente a mesma distribuição que 
uma variável aleatória normal com média e variância iguais aquelas da distribui- 
ção binomial. Esse resultado foi provado originalmente por DeMoivre em 1733 
para o caso especial em que p = 1/2 e foi depois estendido por Laplace em 1812 
para o caso de p qualquer. O teorema diz formalmente que se “padronizarmos” a 
distribuição binomial primeiramente subtraindo desta distribuição sua média np 
e então dividindo o resultado por seu desvio padrão /np(l — p),então a função 
distribuição dessa variável aleatória padronizada (que tem média O e variância 1) 
convergirá para a função distribuição normal à medida que n>0, 


O teorema limite de DeMoivre e Laplace 


Se S, representa o número de sucessos que ocorrem quando n tentativas 
independentes, cada uma com probabilidade de sucesso p, são realizadas, 
então, para qualquer a < b, 


Sn — np 


— Vnpd-p) 


P < | > &D(b) — d(a) 


à medida que n5o0. 
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Como o teorema anterior é apenas um caso especial do teorema do limite 
central, que se discute no Capítulo 8, não vamos apresentar a sua demonstração. 

Note agora que temos duas aproximações possíveis para as probabilida- 
des binomiais: a aproximação de Poisson, que é boa quando n é grande e p 
é pequeno, e a aproximação normal, que se pode mostrar como sendo muito 
boa quando np(1 — p) é grande (veja a Figura 5.6) [a aproximação normal será 
geralmente boa para valores de n satisfazendo np(1 — p) = 10). 


Exemplo 4f 


Seja X o número de vezes nas quais uma moeda honesta que é jogada 40 vezes 
dá cara. Determine a probabilidade de que X = 20. Use a aproximação normal 
e então a compare com a solução exata. 


Solução Para empregarmos a aproximação normal, note que, como a variá- 
vel aleatória binomial é uma variável discreta inteira, enquanto que a variável 
aleatória normal é uma variável contínua, é melhor escrevermos P[X = i] como 
Pfi-12<X<i+ 1/2) antes de aplicarmos a aproximação normal (isso é cha- 
mado de correção de continuidade). Fazendo isso, obtemos 


P(X =20)=P(195 =X < 20,5) 


P 19,55 — 20 XxX —- 20 20,5 — 20 
= —D .— « 
10 10 10 
X — 20 
amplie EE até 
10 

= (0,16) — &(— 0,16) = 0,1272 
ci (10,0,7) e (20,0,7) 
025 

0,15 

0,20 
0,15 0,10 
Co 0.05 
0,05 
BO Go Mot CB qdo O 5 100 15 220 

x x 
e (30,07) o» (50,0,7) 
0,14 0,12 - 
0.12 co 
0.10 
a o 
0,06 
0,04 0,04 
002 0,02 
00 ques 20 25 30 0 q “20 30 40 50 


x 


Figura 5.6 A função de probabilidade de uma variável aleatória binomial com parã- 


metros (n, p) se torna cada vez mais “normal” à medida que n se cresce. 
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O resultado exato é 


P(X=20)= (0) (5) = 0,1254 = 


Exemplo 4g 


O tamanho ideal de uma turma de primeiro ano em uma faculdade particular é 
de 150 alunos. A faculdade, sabendo de experiências anteriores que, em média, 
apenas 30% dos alunos aceitos vão de fato seguir o curso, usa a prática de aprovar 
os pedidos de matrícula de 450 estudantes. Calcule a probabilidade de que mais de 
150 estudantes de primeiro ano frequente as aulas nesta faculdade. 


Solução Se X representa o número de estudantes que seguem o curso, então 
X é uma variável aleatória binomial com parâmetros n = 450 e p = 0,3. Usando 
a correção de continuidade, vemos que a aproximação normal resulta em 
X — (450)(0,3) 150,5 — (450)(0,3) 
n/450(0,3)(0,7) /450(0,3)(0,7) 


P(X = 1505)=P 


= 1 — O(1,59) 

= 0,0559 
Com isso, menos de 6% das vezes mais que 150 dos 450 estudantes aceitos vão 
de fato seguir o curso (que suposições de independência fizemos”). E 
Exemplo 4h 


Para determinar a eficácia de certa dieta para a redução do colesterol no sangue, 
100 pessoas serão analisadas. Após seguirem a dieta por um tempo suficiente, seu 
colesterol será medido. A nutricionista responsável pelo experimento está decidi- 
da a endossar a dieta caso pelo menos 65% das pessoas tenham, após a dieta, uma 
queda em seu colesterol. Qual é a probabilidade de que a nutricionista endosse a 
nova dieta se esta, na realidade, não tiver qualquer efeito no nível de colesterol? 


Solução Vamos supor que, se a dieta não tem efeito no nível de colesterol, 
então, estritamente por acaso, o nível de colesterol de cada pessoa será menor 
do que era antes da dieta com probabilidade 1/2. Com isso, se X é o número de 
pessoas cujo nível de colesterol foi reduzido, então a probabilidade de que a 
nutricionista endosse a dieta quando esta na realidade não tem efeito no nível 
do colesterol é de 


100 100 
bã ( E) (5) =P(X = 645) 

i 2 
i=65 

x — (00d 
= po! co 

V100(i)(3) 

= 1- 02,9) 
= 0,0019 E 


9 
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Exemplo 4i 


Cinquenta e dois por cento dos moradores da cidade de Nova York são a favor 
da proibição do fumo em áreas públicas. Obtenha uma aproximação para a 
probabilidade de que mais de 50% de uma amostra aleatória de n pessoas de 
Nova York sejam a favor dessa proibição quando 


(a) n=11 
(b) n=101 
(c) n = 1001 


Quão grande deve ser n para fazer com que essa probabilidade seja maior que 
0,959 


Solução Seja No número de moradores da cidade de Nova York. Para respon- 
der à questão anterior, devemos primeiro entender que uma amostra de tamanho 
n é uma amostra tal que as n pessoas são escolhidas de maneira que cada um dos 


N : ; 
u subconjuntos de n pessoas tenha a mesma chance de ser o subconjunto es- 


veis à proibição do fumo, é uma variável hipergeométrica. Isto é, S, tem a mesma 
distribuição que o número de bolas brancas obtidas quando n bolas são escolhidas 
de uma urna de N bolas, das quais 0,52 são brancas. Mas como N e 0,52 são gran- 
des em comparação com o tamanho da amostra n, tem-se da aproximação bino- 
mial para a distribuição hipergeométrica (veja a Seção 4.8.3) que a distribuição de 
S, pode ser bem aproximada por uma distribuição binomial com parâmetros n e p 
= 0,52. A aproximação normal para a distribuição binomial mostra então que 


colhido. Consequentemente, S,, o número de pessoas na amostra que são favorá- 


nasal O o Ssp (or 
n(0,52)(0,48) nO SI048) 
Sn — 0,52n 
=P) mma > 0,04 
| 1050045) | al 


= 4(0,04,/n) 
Assim, 


&(0,1328) = 0,5528, sen= 11 
P(S, > 0,5n) = 4 D(0,4020) = 0,6562, sen = 101 
D(1,2665) = 0,8973, sen = 1001 


Para que essa probabilidade seja de pelo menos 0,95, precisaríamos de (0,04.,/n) 
> 0,95. Como P(x) é uma função crescente e D(1,645) = 0,95, isso significa que 


0,04/n > 1,645 


ou 


n = 1691,266 


Isto é, o tamanho da amostra deveria ser de pelo menos 1692 pessoas. E 
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Notas históricas a respeito da distribuição normal 


A distribuição normal foi introduzida pelo matemático francês Abraham 
DeMoivre em 1733. DeMoivre, que usou essa distribuição para aproximar 
as probabilidades associadas a moedas, chamou-a de curva exponencial 
com forma de sino. Sua utilidade, no entanto, se tornou verdadeiramente 
clara apenas em 1809, quando o famoso matemático alemão Karl Friedrich 
Gauss a utilizou como uma parte integral de sua abordagem para a predi- 
ção da localização de entidades astronômicas. Como resultado, tornou-se 
comum desde então chamá-la de distribuição Gaussiana. 

Durante a metade e o fim do século dezenove, contudo, muitos estatís- 
ticos começaram a acreditar que a maioria dos conjuntos de dados deveria 
ter histogramas com a forma Gaussiana. De fato, passou-se a aceitar que 
seria “normal” que qualquer conjunto de dados bem-comportado seguisse 
essa curva. Como resultado, seguindo o estatístico britânico Karl Pearson, 
as pessoas começaram a chamar a curva Gaussiana simplesmente de curva 
normal (uma explicação parcial do porquê de tantos conjuntos de dados se 
comportarem de acordo com a curva normal é fornecida pelo teorema do 
limite central, que é apresentado no Capítulo 8). 


Abraham DeMoivre (1667-1754) 


Hoje não faltam consultores estatísticos, muitos dos quais trilhando o seu 
caminho nos mais elegantes ambientes. Entretanto, o primeiro de sua li- 
nhagem trabalhou, no início do século dezoito, em uma escura e suja casa 
de apostas em Long Acres, Londres, conhecida como a Cafeteria do Car- 
niceiro. Ele foi Abraham DeMoivre, um refugiado protestante da França 
católica, que, por certa quantia, calculava as probabilidades associadas a 
todos os tipos de jogos de azar. 

Embora DeMoivre, o descobridor da curva normal, trabalhasse em 
uma cafeteria, ele era um matemático de reconhecidas habilidades. De 
fato, ele era um membro da Sociedade Real. Diz-se inclusive que era amigo 
íntimo de Isaac Newton. 

Veja a descrição de Karl Pearson imaginando como seria DeMoivre 
trabalhando na Cafeteria do Carniceiro: “Vejo DeMoivre trabalhando em 
uma mesa imunda com um apostador quebrado ao seu lado e Isaac Newton 
avançando por entre a multidão para encontrá-lo. Isso daria um grande qua- 
dro para um artista inspirado” 


Karl Friedrich Gauss 


Karl Friedrich Gauss (1777-1855), um dos primeiros usuários da curva nor- 
mal, foi um dos maiores matemáticos de todos os tempos. Veja o que escre- 
veu o historiador da matemática E. T. Bell em seu livro de 1953, Homens 
da Matemática: em um capítulo intitulado “O Príncipe dos Matemáticos” 
ele diz “Arquimedes, Newton e Gauss; esses três formam uma classe única 
entre os grandes matemáticos, e não é possível que meros mortais tentem 
classificá-los por ordem de mérito. Todos os três provocaram grandes agi- 
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tações tanto na matemática pura quanto na matemática aplicada. Arqui- 
medes estimava sua matemática pura mais do que suas aplicações; Newton 
parece ter encontrado a principal justificativa para as suas invenções ma- 
temáticas em sua utilização científica; por outro lado, Gauss declarou que 
para ele era a mesma coisa trabalhar com matemática pura ou aplicada” 


5.5 VARIÁVEIS ALEATÓRIAS EXPONENCIAIS 


Uma variável aleatória contínua cuja função densidade de probabilidade é 
dada, para algum À > 0, por 


Ac sex z>0 
foo=0 sex < 0 


é chamada de variável aleatória exponencial (ou, mais simplesmente, de expo- 
nencialmente distribuída) com parâmetro À. A função distribuição cumulativa 
F(a) de uma variável aleatória exponencial é dada por 


F(a) = P(X ps a) 


a 
= A Ae dx 
0 


= elo 
=1-ecM 9=0 

Note que F(o0) = [9º Ae ** dx = 1, como deve ser, é claro. Agora mostraremos 

que o parâmetro À é o inverso do valor esperado. 


Exemplo 5a 
Seja X uma variável aleatória exponencial com parâmetro À. Calcule (a) E[X] 


e (b) Var(X). 
Solução (a) Como a função densidade é dada por 


Ac x=>0 


fO) = I 0 x <0 
obtemos, para n > 0, 
E(X”] ne xe dx 
0 


ax 


Integrando por partes (com ke “ = dve u = x), obtemos 


oo 
EIX"] = “Ip + À e nyl dx 
0 
o 
=0+ a) perl dx 
0 


= n n—1 
= ELO] 
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Fazendo n = 1 e depois n = 2, obtemos 


dao 
a 
| 
| 
Ass 
E 
| 
| 


(b) Com isso, 
2 E 
Var(X) = E es (x) =—5 


Assim, a média de uma variável aleatória exponencial é o inverso de seu pará- 
metro à, e a variância é igual ao quadrado da média. E 


Na prática, a distribuição exponencial surge frequentemente como a dis- 
tribuição da quantidade de tempo até que ocorra algum evento específico. Por 
exemplo, a quantidade de tempo (a partir deste momento) até a ocorrência de 
um terremoto, ou até que uma nova guerra tenha início, ou até que um telefo- 
nema que você atenda seja engano são todas variáveis aleatórias que na prática 
tendem a ter distribuições exponenciais (para uma explicação teórica desse fe- 
nômeno, veja a Seção 4.7). 


Exemplo 5b 


Suponha que a duração de um telefonema, em minutos, seja uma variável alea- 
tória exponencial com parâmetro À = 1/10. Se alguém chega logo na sua frente 
em uma cabine telefônica, determine a probabilidade de que você tenha que 
esperar 


(a) mais de 10 minutos; 
(b) entre 10 e 20 minutos. 


Solução Seja X a duração da chamada feita pela pessoa na cabine. Então, as 
probabilidades desejadas são 


(a) 
P(X > 10)=1 — F(10) 


=e! = 0,368 
(b) 
P(10O < X < 20)=FQ0) — F(0) 
=e1 - e? 0233 E 
Dizemos que uma variável aleatória não negativa é sem memória se 


PlX>s+|X>H]=P(X>s) paratodos,t=0 (5.1) 
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Se pensarmos em X como sendo o tempo de vida útil de algum instrumento, a 
Equação (5.1) diz que a probabilidade do instrumento durar por pelo menos s 
+ t horas, dado que ele tenha durado t horas, é igual à probabilidade inicial de 
que ele dure por pelo menos s horas. Em outras palavras, se o instrumento tem 
a idade t, a distribuição da quantidade de tempo restante que ele durará é igual 
à distribuição original de seu tempo de vida útil (em outras palavras, é como se 
o instrumento não se “lembrasse” de que já tenha sido usado por um tempo 1). 
A Equação (5.1) é equivalente a 


PX >s+LX>t) 
P(X > +) 


=P(X >s) 


ou 


PX>s+]=PX>SP|X > (5.2) 


Como a Equação (5.2) é satisfeita quando X é exponencialmente distribuída 

— -Às —h 4 : 2... . . 
(para e NC) = e Ne NS, tem-se que variáveis aleatórias exponencialmente dis- 
tribuídas são sem memória. 


Exemplo 5c 


Considere uma agência de correio que funciona com dois caixas. Suponha 
que quando o Sr. Smith entra na agência ele perceba que a Sra. Jones está 
sendo atendida por um dos caixas e o Sr. Brown pelo outro. Suponha tam- 
bém que tenham dito ao Sr. Smith que ele será atendido assim que o Sr. 
Brown ou a Sra. Jones sair. Se a quantidade de tempo que um caixa gasta 
com um cliente é distribuída exponencialmente com parâmetro à, qual é a 
probabilidade de que, dos três clientes, o Sr. Smith seja o último a deixar a 
agência de correio? 


Solução A resposta é obtida seguindo-se o raciocínio a seguir: considere o 
instante em que o Sr. Smith encontra um caixa livre. Neste momento, ou a Sra. 
Jones ou o Sr. Brown terão acabado de sair, e um deles continuará a ser atendi- 
do. Entretanto, como a variável aleatória exponencial é sem memória, tem-se 
que a quantidade adicional de tempo que a segunda pessoa (a Sra. Jones ou o 
Sr. Brown) ainda ficará na agência de correio é exponencialmente distribuída 
com parâmetro À. Em outras palavras, é como se a pessoa começasse a ser aten- 
dida naquele exato momento. Com isso, por simetria, a probabilidade de que a 
outra pessoa termine de ser atendida antes de o Sr. Smith sair da agência deve 
ser igual a 1/2. a 


Vale notar que a distribuição exponencial é a única distribuição com a pro- 
priedade da falta de memória. Para ver isso, suponha que X seja sem memória 
e faça F(x) = P(X > x). Então, pela Equação (5.2), 


Fís + 9) = F(9)F(O 
Isto é, F(:) satisfaz a equação funcional 


g(s + O = g()g(t) 
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Entretanto, acontece que a única solução contínua à direita dessa equação fun- 
cional é* 


gg) =e (5.3) 
e, como uma função distribuição é sempre contínua à direita, devemos ter 
Foj=e" o Fy)=PRsd=i-0* 


o que mostra que X é exponencialmente distribuída. 


Exemplo 5d 


Suponha que o número de quilômetros que um carro pode rodar sem que 
sua bateria se descarregue seja exponencialmente distribuído com um valor 
médio de 10.000 km. Se uma pessoa deseja fazer uma viagem de 5000 km, 
qual é a probabilidade de que ele ou ela consiga completar a viagem sem ter 
que trocar a bateria do carro? O que pode ser dito quando a distribuição não 
é exponencial? 


Solução Resulta da propriedade de falta de memória da distribuição expo- 
nencial que o tempo de vida útil restante da bateria (em milhares de km) é 
exponencial com parâmetro À = 1/10. Portanto, a probabilidade desejada é 


P(tempo de vida restante > 5) = 1 — F(5) = e =e 2 x 0,604 


Entretanto, se a distribuição da vida útil F não for exponencial, então a propas 
bilidade relevante é 


1-F(4+S5) 


Ptvida útil > + + 5lvida útil > = NES 7 


onde t é o número de quilômetros que a bateria já rodou antes do início da 
viagem. Portanto, se a distribuição não for exponencial, é necessário obter in- 
formações adicionais (isto é, o valor de t) antes que a probabilidade desejada 
possa ser calculada. = 


Uma variação da distribuição exponencial é a distribuição de uma variável 
aleatória que tem a mesma probabilidade de ser negativa ou positiva e cujo 


* Pode-se provar a Equação (5.3) da seguinte maneira: se g(s + t) = g(s)g(t), então 


Hoje) 


e, com a sua repetição, tem-se g(m/n) = g”(1/n). Além disso, 


= 1 1 sad E = 1 1 ao 1/n 
em =s(5 + 5 + +=" (5) ou s(x) = eu» 


Portanto, g(m/n) = (g(1))””, o que, como g é contínua à direita, implica que g(x) = (g(1). 


2 
Como g(1) = (s (3) = 0, obtemos g(x) = e”, onde à = —log(g(1)). 
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valor absoluto é distribuído exponencialmente com parâmetro à, À = 0. Diz-se 
que tal variável aleatória tem uma distribuição de Laplace* e sua função den- 
sidade é dada por 


1 
ff) = she — 0 <x<o 
Sua função distribuição é dada por 


X 
1) 1e* dx x <0 
FG) = 0 1 /* 
1) roxas + 5 [ 2 dx x>0 
0 2 O) 


x <0 


x>0 


Exemplo 5e 


Considere novamente o Exemplo 4e, que supõe que uma mensagem binária 
seja transmitida de A para B, sendo transmitido um 2 quando a mensagem é 
igual a 1, e -2 quando ela é O. Entretanto, suponha agora que, em vez de ser uma 
variável aleatória normal padrão, o ruído de canal N seja uma variável aleatória 
Laplaciana com parâmetro À = 1. Suponha novamente que, se R é o valor rece- 
bido no ponto B, então a mensagem é decodificada da maneira a seguir: 


Se R = 0,5, então conclui-se que 1 foi enviado. 
Se R< 0,5, então conclui-se que O foi enviado. 


Neste caso onde o ruído é Laplaciano com parâmetro À = 1,os dois tipos de 
erros terão probabilidades dadas por 


P(erro|mensagem 1 é enviada) = P(N < —1,5) 


! —1,5 
= 2º 
= 0,1116 
P(erroJmensagem O é enviada) = P(N = 2,5) 
1 
ne 58 
= 0,041 


Comparando-se com os resultados do Exemplo 4e, vemos que as probabilida- 
des de erro são maiores quando o ruído é Laplaciano com À = 1 do que quando 
ele é uma variável normal padrão. 


* Ela também é chamada às vezes de variável aleatória dupla exponencial. 
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5.5.1 Funções taxa de risco 

Considere uma variável aleatória contínua X que interpretamos como sendo a 
vida útil de algum item. Suponha que X tenha função distribuição F e função 
densidade f. A função taxa de risco (que é às vezes chamada de função taxa de 
falhas) N(t) de F é definida como 


vp = 1. onde F=1-F 
E) 
Para interpretar A(t), suponha que o item tenha existido por um tempo t e dese- 
jemos saber a probabilidade de que ele dure por um tempo adicional dt. Isto é, 
considere P(X E (t,t + dijX > 1). Agora, 
PXec(tt+ d),X >) 
P(X > 1) 
— PXe(tt + db) 
o P(X > t) 
x LO q 
F(t) 


PXettt+ d)|X > t)= 


Assim, A(t) representa a intensidade da probabilidade condicional de que um 
item com idade de t unidades apresente defeito. 

Suponha agora que a distribuição do tempo de vida seja exponencial. En- 
tão, pela propriedade da falta de memória, tem-se que a distribuição da vida 
útil restante de um item com idade de t unidades é a mesma da de um item 
novo. Portanto, A(t) deve ser uma constante. De fato, isso se confirma, já que 


Assim, a função taxa de falhas da distribuição exponencial é uma constante. O 
parâmetro À é frequentemente chamado de taxa da distribuição. 

Ocorre que a função taxa de falhas f(t) determina unicamente a distribui- 
ção F. Para provar isso, note que, por definição, 


LF(t) 


dede q F(t) 


Integrando ambos os lados, obtemos 
t 
log(1 — F(t) = -f A(O dt + k 
0 
ou 


t 
1- F(1) -etexp = [ a(o) a 
0 
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Fazendo t = 0, obtemos k = 0; assim, 
t 
F()=1 — exp | A(L) a (5.4) 
0 


Com isso, a função distribuição de uma variável aleatória contínua pode ser 
especificada por meio de sua função taxa de risco. Por exemplo, se uma variável 
aleatória tem uma função taxa de risco linear — isto é, se 


A(D)=a+ bt 
então sua distribuição é dada por 
Fg)=1- eTat-br/2 
e, com o cálculo da derivada, obtemos sua densidade, isto é, 
fo) = (a + bye DÊ ,>0 


Quando a = 0, a equação anterior é conhecida como função densidade de Ray- 
leigh. 


Exemplo 5f 


Ouve-se frequentemente que a taxa de mortalidade de pessoas que fumam é, 
em cada idade, duas vezes maior que a de um não fumante. O que significa 
isso? Significa que um não fumante tem duas vezes mais probabilidade de viver 
certo número de anos do que um fumante da mesma idade? 


Solução Se At) representa a taxa de risco de um fumante com idade te à,(t) 
representa a taxa de risco de um não fumante com a mesma idade, então o 
enunciado em questão é equivalente a dizer que 


As(t) = 2An(t) 
A probabilidade de que um não fumante com A anos de idade viva até a idade 
B,A<B,é 
P(não fumante com idade A atinja a idade B) 


= P(tempo de vida do não fumante > B|tempo de vida do não fumante > 4) 
= 1 — Frão(B) 
| = não (A) 


B 
ex [= [ Antt) a) 
0 


= de (5.4) 


A 

ex [= [ iai 
0 
B 

-epf- [ mod 
A 
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enquanto que a probabilidade correspondente para um fumante é, pelo mesmo 
raciocínio, 


B 
Plfumante com idade A atinja a idade B) = exp |- [ As(t) al 
A 
B 
= exp - | An(t) dt 
A 
2 
B 
= E |-f An(t) || 
A 


Em outras palavras, para duas pessoas de mesma idade, uma delas fumante e a 
outra não fumante, a probabilidade de que um fumante viva até certa idade é 
o quadrado (não a metade) da probabilidade correspondente para um não fu- 
mante. Por exemplo, se À,(t) = 1/30,50 = t = 60, então a probabilidade de que 
um não fumante atinja a idade de 60 anos é igual a e“? = 0,7165, enquanto a 
probabilidade correspondente para um não fumante é de e” = 0,5134. E 


! 


5.6 OUTRAS DISTRIBUIÇÕES CONTÍNUAS 


5.6.1 A distribuição gama 


Diz-se que uma variável aleatória tem distribuição gama com parâmetros (a, 
A), A > 0,4 > 0,se sua função densidade é dada por 


Le (ax) = 
fo= To "º 
0 x < 


onde [(a), chamada de função gama, é definida como 
oo 
(a) = / eYysot dy 
0 
A integração de I'(a) por partes resulta em 


9a eo is —y o a—2 
P(a) = —e”)y aos Eta =D dy 
0 


= (a — nf ey? dy (6.1) 
0 
=(a— Dr(a — 1) 


Para valores inteiros de «, digamos « = n, obtemos, aplicando a Equação (6.1) 
repetidamente, 


PQ) =(n-— Dr(a — 1) 
=(n-— Dan -— D(n — 2 


= Qu gr= 23227) 
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ComoT(1) = dos e* dx = 1, tem-se que, para valores inteiros de n, 
Dn) = (n-1)! 


Quando a é um inteiro positivo, digamos, « = n, a distribuição gama com parã- 
metros (a, À) surge frequentemente, na prática como a distribuição da quanti- 
dade de tempo que se deve esperar até que um total de n eventos ocorra. Mais 
especificamente, se eventos ocorrem aleatoriamente e de acordo com os três 
axiomas da Seção 4.7 então a quantidade de tempo que se deve esperar até que 
um total de n eventos ocorra é uma variável aleatória gama com parâmetros 
(n,A). Para provar isso, suponha que T, represente o instante de ocorrência do 
n-ésimo evento, e note que T, é menor ou igual a t se e somente se o número de 
eventos que ocorreram até o instante t for pelo menos igual a n. Isto é, com N(t) 
igual ao número de eventos em [0, t), 


PlTu<t)= o > n) 


= Es PN(O =)) 


j=n 


onde se obtém a identidade final porque o número de eventos em (0, £] tem 
uma distribuição de Poisson com parâmetro At. Derivando a equação anterior, 
obtemos agora a função densidade de T,: 


ss eNj(agi-IA = so 


fy= 
j=n e no É 
o 3 Ae MATO De MA 
5 SD — 
e par 
= Ae Mar 
(nn D! 


Portanto, T, tem a distribuição gama com parâmetros (n,A) (essa distribuição 
é frequentemente chamada na literatura de distribuição de Erlang). Note que, 
quando n = 1, essa distribuição se reduz à distribuição exponencial. 

A distribuição gama com A=1/2ea = n/2, com n inteiro positivo, é chama- 
da de distribuição x (1ê-se “qui-quadrado”) com n graus de liberdade. A distri- 
buição qui-quadrado surge na prática frequentemente como a distribuição do 
erro envolvido na tentativa de se atingir um alvo em um espaço n-dimensional 
quando cada erro de coordenada é normalmente distribuído. Essa distribuição 
é estudada no Capítulo 6, onde se detalha a sua relação com a distribuição 
normal. 
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Exemplo 6a 
Seja X uma variável aleatória gama com parâmetros a e À. Calcule (a) E[X] e 
(b) Var (X). 
Solução (a) 

1 
To) 


1 = —Ax 
= —— Ao) d 
To |, Ae “(AX)” dx 


T(a + 1) 
AT (o) 
= , pela Equação (6.1) 


E(X] À é Axe (gl dx 
0 


b) Calculando primeiro E[X”], podemos mostrar que 
Pp 


[04 
Var(X) = 7 


Os detalhes são deixados como exercício. | 


5.6.2 A distribuição de Weibull 


A distribuição de Weibull é amplamente utilizada na prática devido à sua versa- 
tilidade. Ela foi originalmente proposta para a interpretação de dados de fadi- 
ga, mas agora seu uso foi estendido para muitos outros problemas de engenha- 
ria. Em particular, ela é amplamente utilizada no campo de fenômenos como a 
distribuição da vida útil de algum objeto, especialmente quando o modelo de 
“elo mais fraco” se aplica para o objeto. Isto é, considere um objeto formado 
por muitas partes e suponha que esse objeto estrague definitivamente quando 
uma de suas partes para de funcionar. É possível mostrar (tanto teorica quanto 
empiricamente) que a distribuição de Weibull fornece uma boa aproximação 
para a distribuição da vida útil do objeto. 
A função distribuição de Weibull tem a forma 


0 X=<Uv 


Fo =1, eo | (: = o o (6.2) 


[94 
Uma variável aleatória cuja função distribuição cumulativa é dada pela Equa- 


ção (6.2) é chamada de variável aleatória de Weibull com parâmetros v, e e f. 
Derivando essa equação, obtemos 


fo) = EE E eo [-(E E | a 
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5.6.3 A distribuição de Cauchy 


Diz-se que uma variável aleatória tem uma distribuição de Cauchy com parâ- 
metro 8, —o < 6 < oo, se sua função densidade é dada por 


1 1 


mL Wo O — 00 < X<0 


fO) = 


Exemplo 6b 


Suponha que uma lanterna de feixe estreito seja girada em torno de seu centro, 
que está localizado a uma unidade de distância do eixo x (veja a Figura 5.7). 
Considere o ponto X no qual o feixe intercepta o eixo x no instante em que a 
lanterna para de girar (se o feixe não estiver apontando para o eixo x, repita o 
experimento). 

Conforme indicado na Figura 5.7 o ponto X é determinado pelo ângulo 6 
entre a lâmpada e o eixo y; este ângulo, como se vê da situação física analisada, 
está uniformemente distribuído entre — 7/2 e 7/2. A função distribuição de X 
é portanto dada por 


Fx) =P(X = x) 
=Plig0 =x) 
=P(0 <tg !x) 

E 


=>+-t 
2" 7º ii 


onde se obtém a última igualdade porque 6, sendo uniforme no intervalo (-7/2, 
7/2), tem distribuição 


a-(-n/2) 1 a x x 
= —= = — — EmA 
Pó = a) = = 3 <4<5 
Portanto, a função densidade de X é dada por 
d 1 
= a — O < X < 00 


0 X eixo-x 


Figura 5.7 
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e vemos que X tem a distribuição de Cauchy.* = 


5.6.4 A distribuição beta 
Diz-se que uma variável aleatória tem uma distribuição beta se sua densidade 
é dada por 
1 
fo) =1 B(a,b) 
0 caso contrário 


Ade qexal 


onde 
1 
B(a,b) = [ xd — 9? dx 
0 


A distribuição beta pode ser usada para modelar um fenômeno aleatório 
cujo conjunto de valores possíveis é algum intervalo finito [c, d] - o qual, se 
considerarmos que c é a origem e d — c é uma unidade de medida, pode ser 
transformado no intervalo [0, 1]. 

Quando a = b,a função densidade beta é simétrica em torno de 1/2, dando 
mais e mais peso para as regiões em torno de 1/2 à medida que o valor comum 
a aumenta (veja a Figura 5.8). Quando b > a, a densidade se inclina para a es- 
querda (no sentido de que valores menores se tornam mais prováveis); ela se 
inclina para a direita quando a > b (veja a Figura 5.9). 

Pode-se mostrar que a relação 

Par (b) 


existe entre 
1 
B(a,b) = / xd — a?-ldx 
0 
e a função gama. 


* Pode-se ver que (tg x) =1/(1 + x?) da forma a seguir:se y = tg x, então tg y = x, 
de forma que 


d d dy d fseny) dy cos? y + sen? vyidy 
l= t = t — = 
dx CE) dy EN e dy (2) dx cos? dx 


2 
st dy a cos“ y — 1 1 


dx senty+co2y tgy+1 241 
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Figura 5.8 Funções densidade beta com parâmetros (a, b) quando a = b. 


Usando a Equação (6.1) com a identidade (6.3), é fácil mostrar que, se X é uma 
variável aleatória beta com parâmetros a e b, então 
a 


Li Dre 


ab 


VE E Gs DA 


Observação: Uma verificação da Equação (6.3) aparece no Exemplo 7c 
do Capítulo 6. H 


fl) 


x 


Figura 5.9 Funções densidade beta com parâmetros (a, b) quando ala + b) = 
1/20. 
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5.7 A DISTRIBUIÇÃO DE UMA FUNÇÃO DE 
UMA VARIÁVEL ALEATÓRIA 


Com frequência, conhecemos a distribuição de probabilidade de uma variável 
aleatória e estamos interessados em determinar a distribuição de alguma fun- 
ção dessa variável. Por exemplo, suponha que conheçamos a distribuição de X 
e queiramos obter a distribuição de g(X). Para fazer isso, é necessário expressar 
o evento em que g(X) = y em termos de X em algum conjunto. Isso é ilustrado 
nos exemplos a seguir. 


Exemplo 7a 


Suponha que X seja uniformemente distribuído ao longo do intervalo (0,1). 
Obtemos a distribuição da variável aleatória Y, definida como Y = X”, da se- 
guinte maneira:para0 <y <1, 
FyQ)=PY =) 
=P(X” <y) 
=P(X sy") 


= Fx!) 
= ir 


Por exemplo, a função densidade de Y é dada por 
1 1/n-1 0 =< y <1 


0 caso contrário 


Exemplo 7b 
Se X é uma variável aleatória contínua com densidade de probabilidade f,, en- 
tão a distribuição de Y = Xº é obtida da seguinte maneira: para y = 0, 
FO =PY=<y) 
=PX” = y) 
=P(-y<X=<o)) 
= Fy(vV)) — Fx(-4)) 


Derivando, obtemos 


fr) = PAIS) +fx(— 49] E 


Exemplo 7c 
Se X tem uma função densidade f,, então pode-se obter a função densidade de 
Y = |X] conforme a seguir: para y = 0, 
FW=PW =) 
=PIX|=)y) 
=P-y<sÃAsoy) 
= Fyx0) — Fx(-y) 
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Derivando a equação acima, obtemos 


HO) +IA) y=0 E 


O método empregado nos Exemplos 7a a 7c pode ser usado para demonstrar 
o Teorema 71. 


Teorema 71 Seja X uma variável aleatória contínua com função densida- 
de de probabilidade f,. Suponha que g(x) seja uma função de x estritamente 
monotônica (crescente ou decrescente) e derivável (portanto contínua). En- 
tão a variável aleatória Y definida por Y = g(X) tem uma função densidade 
de probabilidade dada por 


se y = g(x) para algum x 


d 
fxlg 109] 870) 


0 sey * g(x) para todo x 


AO) = 


onde se define g'(y) de forma que essa função corresponda ao valor de x 
para o qual g(x) = y. 
Vamos demonstrar o Teorema 71 quando g(x) é uma função crescente. 


Prova Suponha que y = (x) para x qualquer. Então, com Y = g(X), 
Fy0) = Plg(X) =) 


=PX <g'g) 
= Fy(g !(y) 
Calculando a derivada, obtemos 
d 
frQ) = fx" 0) 5,80) E 


o que está de acordo com o Teorema 71, já que g '(y) é não decrescente, e com 
isso sua derivada é não negativa. 

Quando y  g(x) para qualquer x, Fy(y) é igual a O ou 1, e em ambos os 
casos f(y) = 0. 


Exemplo 7d 


Seja X uma variável aleatória contínua não negativa com função densidade f, e 
Y = X”. Determine f,, a função densidade de probabilidade de Y. 


Solução Se g(x) = x”, então 


gi =ym 


dim o 1 1/n-1 
dy! (0)) = Ea 
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Portanto, do Teorema 71, obtemos 
Lim 
fr) = = rolo) 
Para n = 2, essa equação resulta em 


1 
fr) = 295! 4) 


o que, como X = 0, está de acordo com o resultado do Exemplo 7b. = 


RESUMO 


Uma variável aleatória X é contínua se existir uma função não negativa f, chama- 
da de função densidade de probabilidade de X, tal que, para qualquer conjunto B, 


P(X e Bl= À fO) dx 
B 
Se X é contínua, então sua função distribuição F é derivável e 
d 
FO) = 
ar 6) ='[00) 
O valor esperado de uma variável aleatória contínua é 


E[X] = fre dx 


Uma identidade útil é a de que, para qualquer função g, 
oo 
ElgCO] = | scoftads 


—00 


Como no caso de uma variável aleatória discreta, a variância de X é definida 
como 


Var(X) = EX — EX)? 


Diz-se que uma variável aleatória X é uniforme ao longo do intervalo (a, b) se 
sua função densidade de probabilidade é dada por 


gar 
fO)=4b-a 


0 caso contrário 


asx<b 


Seu valor esperado e sua variância são 


RE 2 
a+b Var) = (b — a) 


El] = 
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Diz-se que uma variável aleatória X é normal com parâmetros u e o se sua 
função densidade de probabilidade é dada por 


1 
fO) = e auÊro go <x<o 
no 


Pode-se mostrar que 
u=E(X] 0? = Var(X) 
Se X é normal com média q e variância &, então Z, definida por 
a 
o 


f= 


é normal com média O e variância 1. Tal variável aleatória é chamada de variável 
aleatória normal padrão. Probabilidades associadas a X podem ser escritas em 
termos de probabilidades associadas à variável aleatória normal padrão Z, cuja 
função distribuição de probabilidade pode ser obtida por meio da Tabela 5.1. 
Quando n é grande, a função distribuição de probabilidade de uma variável 
aleatória binomial com parâmetros n e p pode ser aproximada por uma função dis- 
tribuição de uma variável aleatória normal com média np e variância np(1 — p). 
Uma variável aleatória cuja função densidade de probabilidade é da forma 


Ac x=>0 
IO) = 0) caso contrário 


é chamada de variável aleatória exponencial com parâmetro À. Seu valor espe- 
rado e sua variância são, respectivamente, 


1 1 
E[X] = R Var(X) = 7 


Uma importante propriedade apresentada somente por variáveis aleatórias ex- 
ponenciais é a de que elas não possuem memória, no sentido de que, para s e £ 
positivos, 


PX >s+HiIX > 0=PX>s) 


Se X representa a vida de um item, então a propriedade da falta de memória 
diz que, para qualquer +, a vida restante de um item com idade de t anos tem a 
mesma distribuição de probabilidade que a vida de um item novo. Assim, não 
é necessário conhecer a idade de um item para saber a distribuição de sua vida 
restante. 

Suponha que X seja uma variável não negativa contínua com função distri- 
buição F e função densidade f. A função 


ÃO) 


AO =7 FO 


é chamada de função taxa de risco, ou taxa de falhas, de F. Se interpretarmos 
X como sendo a vida de um item, então, para valores pequenos de dt, A(t)dt é 
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aproximadamente a probabilidade de que um item com idade de t unidades 
falhe em um tempo adicional dt. Se F é uma distribuição exponencial com pa- 
râmetro à, então 


MO) =A tz0 


Vale notar que a distribuição exponencial é a única função distribuição que 
possui uma taxa de falhas constante. 

Uma variável aleatória possui uma distribuição gama com parâmetros a e 
à se sua função densidade de probabilidade é igual a 


Ae (AX) 


da 72 x=0 


e 0, caso contrário. A grandeza T(a) é chamada de função gama e é definida 
por 


o 
T(a) a ex dx 
0 


O valor esperado e a variância de uma variável aleatória gama são, respectiva- 
mente, 


Uma variável aleatória possui distribuição beta com parâmetros (a, b) se sua 
função densidade de probabilidade é igual a 


fO) = 


XIid-al qux=<l 


B(a,b) 


e é igual a 0, caso contrário. A constante B(a, b) é dada por 
1 
B(a,b) = / xa — w-ldx 
0 


A média e a variância dessa variável aleatória são, respectivamente, 


a ab 
is MG O 


PROBLEMAS 


5.1 Seja X uma variável aleatória com função 5.2 Um sistema formado por uma peça origi- 
densidade de probabilidade nal mais uma sobressalente pode funcio- 


nar por uma quantidade de tempo alea- 
tória X. Se a densidade de X é dada, em 


unidades de meses, por 


“Jql-x) -1I<x<1 
Pie f caso contrário 


(a) Qual é o valor de c? Cxe 2 x>0 
(b) Qual é a função distribuição cumula- FO) = 1 O 


tiva de X? 
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qual é a probabilidade de que o sistema 
funcione por pelo menos 5 meses? 
5.3 Considere a função 


5 
0O<x<s 


C(Qx — 2º) 
0 caso contrário 


fO) = | 


Poderia f ser uma função densidade de 
probabilidade? Caso positivo, determine 
C. Repita considerando que a função f(x) 
seja dada por 


-* B) 
O xº) penas 
caso contrário 


5.4 A função densidade de probabilidade de 
X, que representa a vida útil de certo tipo 
de equipamento eletrônico, é dada por 


O x=10 


(a) Determine P(X > 20) 

(b) Qual é função distribuição cumulativa 
de X? 

(c) Qual é a probabilidade de que, de 6 
componentes como esse, pelo menos 3 
funcionem por pelo menos 15 horas? 
Que suposições você está fazendo? 

5.5 Um posto de gasolina é abastecido com 
gasolina uma vez por semana. Se o volu- 

me semanal de vendas em milhares de li- 

tros é uma variável aleatória com função 

densidade de probabilidade 


0O<x<l 


sa — x! 
0 caso contrário 


fo) = 


qual deve ser a capacidade do tanque 
para que a probabilidade do fornecimen- 
to não ser suficiente em uma dada sema- 
na seja de 0,012 

5.6 Calcule E[X] se X tem uma função densi- 


dade dada por 
Exe*2 
(a) fogy= 180 4>0., 
0 caso contrário 
> 
b = Jeca — xº) —I<x<tl, 
(bj fea 0 caso contrário 
o 
=> 5 
(O fo=-(2 172 
O. xES 


5.7 A função densidade de X é dada por 


0=x=<l 
caso contrário 


2 
fo = a bx 


Se E[LX] = 3/5, determine a e b. 

5.8 O tempo de vida, medido em horas, de 
uma válvula eletrônica é uma variável 
aleatória com função densidade de pro- 


babilidade dada por 

fo) =xe—". x=0 
Calcule o tempo de vida esperado dessa 
válvula. 


5.9 Considere o Exemplo 4b do Capítulo 4, 
mas agora suponha que a demanda sazonal 
seja uma variável aleatória contínua com 
função densidade de probabilidade f. Mos- 
tre que o estoque ótimo é o valor s* que 
satisfaz 

b 
* — 
dare 

onde b é o lucro líquido por venda, £t é o 

a perda líquida por unidade não vendida 

e Fé a função distribuição cumulativa da 

demanda sazonal. 

5.10 Trens em direção ao destino 4 chegam 
na estação em intervalos de 15 minutos a 
partir das 7:00 da manhã, enquanto trens 
em direção ao destino B chegam à esta- 
ção em intervalos de 15 minutos come- 
cando às 7:05 da manhã. 

(a) Se certo passageiro chega à estação 
em um horário uniformemente dis- 
tribuído entre 7:00 e 8:00 da manhã e 
pega o primeiro trem que chega, em 
que proporção de tempo ele vai para 
o destino A? 

(b) E se o passageiro chegar em um horá- 
rio uniformemente distribuído entre 
7:10 e 8:10 da manhã? 

5.11 Um ponto é escolhido aleatoriamente em 
um segmento de reta de comprimento L. 
Interprete este enunciado e determine a 
probabilidade de que a relação entre o 
segmento mais curto e o mais longo seja 
menor que 1/4. 

5.12 Um ônibus viaja entre as cidades A e B, 
que estão 100 km uma da outra. Se o ôni- 
bus estragar, a distância da pane até a cida- 
de A tem distribuição uniforme ao longo 
do intervalo (0,100). Há oficinas na cidade 
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A, na cidade B e no meio da estrada entre 
A e B. Sugere-se que seria mais eficiente 
ter três oficinas localizadas em distâncias 
de 25,50 e 75 km, respectivamente, a partir 
de A. Você concorda com isso? Por quê? 

5.13 Você chega na parada de ônibus às 10:00, 
sabendo que o ônibus chegará em algum 
horário uniformemente distribuído entre 
10:00 e 10:30. 

(a) Qual é a probabilidade de que você te- 
nha que esperar mais de 10 minutos? 

(b) Se, às 10:15, o ônibus ainda não tiver 
chegado, qual é a probabilidade de 
que você tenha que esperar pelo me- 
nos mais 10 minutos? 

5.14 Seja X uma variável aleatória uniforme 
no intervalo (0, 1). Calcule E[X"] usando 
a Proposição 2.1 e depois verifique o re- 
sultado usando a definição de esperança. 

5.15 Se X é uma variável aleatória normal com 
parâmetros yu = 10 e &? = 36, calcule 
(a) P(X>5]) 

(b) P4<X< 16) 
(c) P(X <8) 

(d) P(X < 20) 

(e) P(X > 16) 

5.16 O volume anual de chuvas (em mm) em 
certa região é normalmente distribuído 
com yu = 40€ 0 = 4. Qual é a probabilidade 
de que, a contar deste ano, sejam necessá- 
rios mais de 10 anos antes que o volume 
de chuva em um ano supere 50 mm? Que 
hipóteses você está adotando? 

5.17 Um homem praticando tiro ao alvo rece- 
be 10 pontos se o tiro estiver a 1 cm do 
alvo, 5 pontos se estiver entre 1 e 3 cm do 
alvo, e 3 pontos se estiver entre 3 e 5 cm 
do alvo. Determine o número esperado 
de pontos que ele receberá se a distância 
do ponto de tiro até o alvo for uniforme- 
mente distribuída entre O e 10. 

5.18 Suponha que X seja uma variável aleató- 
ria normal com média 0,5. Se P(X > 9) = 
0,2, qual é o valor de Var(X), aproximada- 
mente? 

5.19 Seja X uma variável aleatória normal com 
média 12 e variância 4. Determine o valor 
de ctal que P(X > c) = 0,10. 

5.20 Se 65% da população de uma grande 
comunidade são a favor de um aumento 
proposto para as taxas escolares, obtenha 


uma aproximação para a probabilidade 

de que uma amostra aleatória de 100 pes- 

soas contenha 

(a) pelo menos 50 pessoas a favor da pro- 
posta; 

(b) entre 60 e 70 pessoas (inclusive) a fa- 
vor; 

(c) menos de 75 pessoas a favor. 

5.21 Suponha que a altura de um homem de 
25 anos de idade, em cm, seja uma variá- 
vel aleatória normal com parâmetros u = 
180 e o” = 16. Que percentual de homens 
de 25 anos de idade tem mais de 1,88 de 
altura? Que percentual de homens em um 
time de 6 jogadores tem mais de 1,96 m de 
altura? 

5.22 A espessura de uma forja de duralumí- 
nio (em mm) é normalmente distribuída 
com u = 22,86 e o = 0,0762. Os limites 
de especificação foram dados como 22,86 
+ 0,127 mm. 

(a) Que percentual de forjas será defeitu- 
oso? 

(b) Qual é o valor máximo permissível de 
o que permitirá que não exista mais 
de 1 forja defeituosa em 100 se as es- 
pessuras forem de q = 22,86 € 0? 

5.23 Realizam-se mil jogadas independentes 
de um dado honesto. Calcule a probabi- 
lidade aproximada de que o número 6 
apareça entre 150 e 200 vezes, inclusive. 
Se o número 6 aparecer exatamente 200 
vezes, determine a probabilidade de que 
o número 5 apareça menos de 150 vezes. 

5.24 O tempo de vida útil de componentes de 
computador produzidos por certo fabri- 
cante de semicondutores é normalmente 
distribuído com parâmetros wu = 1,4 X 10º 
horas e o = 3 x10” horas. Qual é a proba- 
bilidade aproximada de que um lote com 
100 componentes contenha pelo menos 
20 componentes cujos tempos de vida útil 
sejam menores que 1,8 x 10º? 

5.25 Cada item produzido por certo fabricante 
é, independentemente, de qualidade acei- 
tável com probabilidade 0,95. Obtenha 
uma aproximação para a probabilidade 
de que mais de 10 dos próximos 150 itens 
fabricados sejam inaceitáveis. 

5.26 Dois tipos de moedas são produzidos em 
uma fábrica; uma moeda honesta e uma 
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moeda viciada que dá cara 55% das vezes. 
Temos uma dessas moedas, mas não sabe- 
mos se ela é honesta ou viciada. De for- 
ma a descobrir que tipo de moeda temos, 
realizamos o seguinte teste estatístico: 
jogamos a moeda 1.000 vezes. Se a moe- 
da der cara 525 vezes ou mais, então con- 
cluiremos que ela é a moeda viciada. Por 
outro lado, se a moeda der cara menos de 
525 vezes, então concluiremos que ela é a 
moeda honesta. Se a moeda é realmente 
a moeda honesta, qual é a probabilidade 
de que cheguemos a uma conclusão falsa? 
Qual seria essa probabilidade se a moeda 
fosse viciada? 


5.27 Em 10.000 jogadas independentes de uma 


5.28 


5.29 


5.30 


moeda, observou-se que deu cara 5800 
vezes. É razoável supor que essa moeda 
não seja honesta? Explique. 

Doze por cento da população são de ca- 
nhotos. Obtenha um valor aproximado 
para a probabilidade de que existam pelo 
menos 20 canhotos em uma escola de 200 
alunos. Enuncie as suas hipóteses. 

Um modelo para o movimento de uma 
ação supõe que, se o preço atual da ação é 
s, então, após certo período, ele será us com 
probabilidade p ou ds com probabilidade 
1 - p. Supondo que movimentos sucessivos 
sejam independentes, obtenha uma aproxi- 
mação para a probabilidade de que o preço 
da ação esteja em alta pelo menos 30% do 
tempo ao longo dos próximos 1000 perío- 
dos se u = 1,012, d = 0,990 e p = 0,52. 
Uma imagem é dividida em duas regiões, 
uma branca e outra preta. Uma leitura feita 
a partir de um ponto escolhido aleatoria- 
mente na região branca é normalmente dis- 
tribuída com y = 4e o” = 4, enquanto uma 
feita a partir de um ponto escolhido alea- 
toriamente na região preta é normalmente 
distribuída com u = 6€ o” = 9. Um ponto 
é aleatoriamente escolhido na imagem e 
tem-se uma leitura de 5. Se a fração preta 
da imagem é igual a «, para que valor de a 
a probabilidade de se cometer um erro não 
mudaria independentemente do fato de o 
ponto estar na região branca ou preta? 


5.31 (a) Uma estação de bombeiros deve ser 


instalada ao longo de uma estrada 
com comprimento 4, 4 < o, Se in- 


5.32 


5.33 


5.34 


5.35 


Mt) = 0,027 + 0,00025(t — 40 


cêndios ocorrem em pontos unifor- 
memente distribuídos no intervalo (0, 
A), qual deveria ser a localização da 
estação de forma a minimizar-se a dis- 
tância esperada para o incêndio? Isto 
é, escolha a de forma que 


E[|X — al] seja minimizado 


quando X for uniformemente distri- 

buído ao longo de (0, 4). 

Agora suponha que a estrada tenha 

comprimento infinito — indo do ponto 

O até o. Se a distância de um incên- 

dio até o ponto O é exponencialmente 

distribuída com taxa A, onde deveria 
estar localizada a estação? Isto é, que- 

remos minimizar Ef|X — al], onde X é 

agora exponencial com taxa À. 

O tempo (em horas) necessário para a 

manutenção de uma máquina é uma va- 

riável aleatória exponencialmente distri- 

buída com À=1/2. Qual é 

(a) a probabilidade de que um reparo 
dure mais que 2 horas? 

(b) a probabilidade condicional de que o 
tempo de reparo dure pelo menos 10 
horas, dado que a sua duração seja su- 
perior a 9 horas? 

O número de anos que um rádio funciona 
é exponencialmente distribuído com À = 
1/8. Se João comprar um rádio usado, qual 
é a probabilidade de que ele funcione por 
mais 8 anos? 
João sabe que a distância, em milhares de 
quilômetros, que um carro pode rodar an- 
tes de ir para o ferro-velho é uma variável 
aleatória exponencial com parâmetro 1/20. 
José tem um carro que ele diz ter dirigido 
por 16.000 km. Se João comprar esse carro, 
qual é a probabilidade de que ele consiga 
rodar pelo menos 32.000 com ele? Repita 
supondo que a distância que o carro pode 
rodar não seja exponencialmente distri- 
buída, mas sim uniformemente distribuída 
em (0, 64) (em milhares de km). 

A taxa de risco A(t) de câncer no pulmão 

de um fumante homem com idade de + 

anos é tal que 


(b) 


t=40 


Supondo que um homem fumante de 40 
anos de idade sobreviva a todos os de- 
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mais riscos, qual é a probabilidade de que 
viva até as idades de (a) 50 e (b) 60 anos 
sem desenvolver câncer no pulmão? 

5.36 Suponha que a distribuição da vida útil de 
um item tenha função taxa de risco A(t) = 
É,t> 0. Qual é a probabilidade de que 
(a) o item dure mais que 2 anos? 

(b) a vida útil do item esteja entre 0,4 e 
1,4 anos? 

(c) um item com 1 ano de vida dure mais 
que 2 anos? 

5.37 Se a variável aleatória X é uniformemen- 
te distribuída ao longo do intervalo (-1, 
1), determine: 

(a) PIX|> 112); 
(b) a função densidade da variável alea- 
tória |X]. 


5.38 Se a variável aleatória Y é uniformemen- 


5.39 Se X é uma variável aleatória exponencial 
com parâmetro À = 1, calcule a função 
densidade de probabilidade da variável 
aleatória Y definida como Y = log X. 

5.40 Se X é uniformemente distribuída ao lon- 
go do intervalo (0, 1), determine a função 
densidade de Y = e”. 

5.41 Determine a distribuição de R = A sen 
8, onde A é uma constante fixa, e O é 
uma variável aleatória uniformemente 
distribuída em (-7/2, 7/2). A variável 
aleatória R surge da teoria da balística. 
Se um projétil é disparado de sua origem 
com um ângulo a em relação à superfície 
da terra com uma velocidade v, então o 
ponto R no qual ele retorna à terra pode 
ser escrito como R = (v?/g)sen 2e, onde 
g é a aceleração da gravidade, que é igual 


te distribuída ao longo do intervalo (0,5), a98 mid 
qual é a probabilidade de que as raízes da , 
equação 4% +4xY+Y+2=O0sejam 
ambas reais? 

EXERCÍCIOS TEÓRICOS 


5.1 A velocidade de uma molécula em um 
gás uniforme é uma variável aleatória 
cuja função densidade de probabilidade é 
dada por 


—bx? 


— Jaxe x=0 
foo= [a x<0 


onde b = m2kTek, Tem representam, 
respectivamente, a constante de Boltzmann, 
a temperatura absoluta do gás, e a massa da 
molécula. Avalie a em termos de b. 

5.2 Mostre que 


[9.0] oo 
epi= [ Pr > nd [ Pr <a 
0 0 
Dica: Mostre que 


[816] 0 
Ê P(Y < —yldy= -f xfy (x) dx 
0 [900] 


[rr > y)dy= TREO dx 
0 0 


5.3 Mostre que, se X tem função densidade f, 
então 


Elg00] = Il ECf() dx 


Dica: Usando o Exercício Teórico 5.2, co- 
mece com 


ElgCO]= [ PICO >) dy [ P(gUO) <—y)dy 


e então proceda como na demonstração 
dada no texto quando g(X) = 0. 

5.4 Demonstre o Corolário 2.1. 

5.5 Use o resultado que diz que, para uma va- 
riável aleatória não negativa Y, 


E[Y] - [eo > dt 


para mostrar, para uma variável aleatória 
não negativa X, 


£o0) 
ELX”] = [ ne iPX > sjdx 
0 


Dica: Comece com 


E[X”"] - [pur > tydt 


e faça a mudança de variáveis 1 = x”. 
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5.6 Defina uma coleção de eventos E£,0 <a 
< 1,coma propriedade de que P(E,) = 1 


para todoamas P[ (E; | =0. 
a 


Dica: Considere X uniforme no intervalo 
(0,1) e defina cada E, em termos de X. 

5.7 O desvio padrão de X, representado como 
SD(X),é dado por = 


SD(X) = [Var(x)]? 


Calcule SD(aX + b) se X tem variância o”. 

5.8 Seja X uma variável aleatória que assuma 
valores entre 0 ec. Istoé, PO =X =c)= 
1. Mostre que 


Var(Ã) = C/4 


Dica: Uma possível abordagem é mostrar 
primeiro que 


ELO] = cE(X] 


e depois usar esta desigualdade para mos- 
trar que 


Var(X) = cfa(1 — a)] onde a = E[XJc 


5.9 Mostre que Z é uma variável aleatória 
normal padrão pois, para x > 0, 
(a) P[Z>x])=P|Z< —x]); 
(b) P[IZ|> x) = 2P(Z > x); 
(co) PllZl<x)=2P|Z <x)-1 

5.10 Seja f(x) a função densidade de probabi- 
lidade de uma variável aleatória normal 
com média q e variância o”. Mostre que 
— ceu + o são pontos de inflexão dessa 
função. Isto é, mostre que f“(x) = O quan- 
dox=u-—coux=u+o. 

5.11 Seja Z uma variável aleatória normal pa- 
drão Z e g uma função derivável com de- 
rivada g”. 

(a) Mostre que Elg'(Z)] = ElZg(Z)) 
(b) Mostre que E[Z""] = nE[Z" 9 
(c) Calcule E[Z9. 

5.12 Use a identidade do Exercício Teórico 
5.5 para deduzir E(X”] quando X é uma 
variável aleatória exponencial com pa- 
râmetro À. 

5.13 A mediana de uma variável aleatória 
contínua com função distribuição F é o 
valor de m tal que F(m) = 1/2. Isto é, uma 
variável aleatória tem a mesma probabili- 
dade de ser maior ou menor que sua me- 
diana. Determine a mediana de X se X é 


(a) uniformemente distribuída ao longo 
de (a, b); 

(b) normal com parâmetros q, o”; 

(c) exponencial com taxa À. 

5.14 A moda de uma variável aleatória con- 
tínua com densidade f é o valor de x no 
qual f(x) atinge seu máximo. Calcule 
a moda de X nos casos (a), (b) e (c) do 
Exercício Teórico 5.13. 

5.15 Se X é uma variável aleatória exponen- 
cial com parâmetro à, e c > 0, mostre que 
cX é exponencial com parâmetro N/c. 

5.16 Calcule a função taxa de risco de X quan- 
do X é uniformemente distribuída no in- 
tervalo (0, a). 

5.17 Se X tem função taxa de risco A (t), cal- 
cule a função taxa de risco de aX onde a é 
uma constante positiva. 

5.18 Verifique que a função densidade gama 
tem integral igual a 1. 

5.19 Se X é uma variável aleatória exponen- 
cial com média 1/A, mostre que 


ELO ARDE  K=1,2u 


Dica: Utilize a função densidade gama 
para calcular a equação anterior. 
5.20 Verifique que 


Var(X) = a/x? 


quando X é uma variável aleatória gama 
com parâmetros a e À. 
5.21 Mostre que T (3) UA 


Dica:T (3) = fo e*xW2 dx. Faça a mu- 
dança de Variáveis y = 2x e então rela- 
cione a expressão resultante com a distri- 
buição normal. 

5.22 Calcule a função taxa de risco de uma va- 
riável aleatória gama com parâmetros (a, 
À) e mostre que ela é crescente quando « 
= 1 e decrescente quando a = 1. 

5.23 Calcule a função taxa de risco de uma va- 
riável aleatória de Weibull e mostre que 
ela é crescente quando 2 = 1 e decrescen- 
te quando B = 1. 

5.24 Mostre que um gráfico de log(log(1 — 
F(x))") em função de log x é uma linha 
reta com inclinação 8 quando F(-) é uma 
função distribuição de Weibull. Mostre 
também que aproximadamente 63,2% de 
todas as observações dessa distribuição 
são menores que «. Suponha que v = 0. 


5.25 Seja 


mostre que, se X é uma variável aleatória 
de Weibull com parâmetros v,a e 8, então 
Y é uma variável aleatória exponencial 
com parâmetro À = 1 e vice-versa. 

5.26 Se X é uma variável aleatória beta com 
parâmetros a e b, mostre que 


ab 


Vastid (a+ba+b+ 1) 


5.27 Se X é uniformemente distribuída em (a, 
b), qual variável aleatória que varia line- 
armente com X é uniformemente distri- 
buída em (0, 1)? 
5.28 Considere a distribuição beta com parâ- 
metros (a, b). Mostre que 
(a) quando a > 1 e b > 1,a densidade é 
unimodal (isto é, ela tem um único 
modo) com modo igual a (a — D/(1 + 
b-2); 

(b) quandoa =1,b<=lea+b<2,a 
densidade é unimodal com modo em 
0 ou 1 ou tem forma de U com modos 
emb0el; 

(c) quando a = 1 = b, todos os pontos em 
[0,1] são modos. 

5.29 Seja X uma variável aleatória contínua 
com função distribuição cumulativa F. 
Defina a variável aleatória Y como Y = 
F(X). Mostre que Y é uniformemente dis- 
tribuída em (0,1). 

5.30 Suponha que X tenha função densidade 
de probabilidade f,. Determine a função 
densidade de probabilidade da variável 
aleatória Y definida como Y = aX + b. 

5.31 Determine a função densidade de probabi- 
lidade de Y = e“ quando X é normalmente 
distribuída com parâmetros q e o”. Diz-se 
que a variável aleatória Y tem distribuição 
log-normal (já que log Y tem distribuição 
normal) com parâmetros pe o”. 

5.32 Sejam Xe Y variáveis aleatórias indepen- 
dentes que têm a mesma probabilidade, 
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cada uma delas, de assumir qualquer va- 

lor 1,2,..., (10), onde N é muito grande. 

Suponha que D represente o maior divi- 

sor comum de X e Y,e também que Q, = 

PID=k). 

(a) Forneça um argumento heurístico 
para O, = (UKO,. 
Dica: Note que, para que D seja igual 
a k, k deve ser um divisor de X e Y. 
Além disso, X/k e Y/k devem ser re- 
lativamente primos (isto é, X/k e Y/k 
devem ter um maior divisor comum 
iguala 1). 

(b) Use a letra (a) para mostrar que 


O, = P(X e Y sejam relativamente primos) 


1 
So 
351k 
k=1 


É sabido que SF 1/k = n?/6, então 


T. E 
OQ, = —5 (na teoria dos números, este 
x 


é conhecido como o teorema de Le- 
gendre). 
(c) Mostre agora que 


onde P, é o i-ésimo menor número 
primo maior que 1. 

Dica: X e Y serão relativamente pri- 
mos se eles não tiverem fatores pri- 
mos em comum. Portanto, da letra (b), 
vemos que 


que foi observado mas não explicado 
no Problema 11 do Capítulo 4 (a re- 
lação entre este problema e o Proble- 
ma 11 do Capítulo 4 é que Xe Y são 
relativamente primos se XY não tiver 
fatores primos múltiplos). 

5.33 Prove o Teorema 71 quando g(X) é uma 

função decrescente. 
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PROBLEMAS DE AUTOTESTE E EXERCÍCIOS 


5.1 O número de minutos jogados por certo 
jogador de basquete em um jogo aleato- 
riamente escolhido é uma variável aleató- 
ria cuja função densidade de probabilida- 
de é dada na figura a seguir: 


0,050 


0,025 


10 20 30 40 


Determine a probabilidade de que o jo- 
gador jogue 
(a) mais de 15 minutos; 
(b) entre 20 e 35 minutos; 
(c) menos de 30 minutos; 
(d) mais de 36 minutos. 

5.2 Para alguma constante c, a variável alea- 
tória X tem a função densidade de proba- 
bilidade 


fo) = co” 0O<x<l 
“10 caso contrário 


Determine (a) ce (b) P(X > x),0<x< 
1. 

5.3 Para alguma constante c, a variável alea- 
tória X tem a função densidade de proba- 
bilidade 


Jo 0<x<2 

ido | O | caso contrário 
Determine (a) E[X] e (b) Var(X). 

5.4 A variável aleatória X tem função densi- 
dade de probabilidade 


Jaatrbx 0<x<1 
A da | 0 caso contrário 


Se E([X] = 0,6, determine (a) P(X < 1/2] 
e (b) Var(X). 

5.5 A variável aleatória X é chamada de va- 
riável aleatória uniforme discreta nos in- 
teiros 1,2....,n se 

P(X =i) = E = 1,2,...,n 
n 
Para qualquer número real não negati- 
vo x, represente Int(x) (às vezes escrito 
como [x]) como o maior inteiro menor ou 
igual a x. Mostre que, se U é uma variável 


aleatória uniforme em (0, 1), então X = 

Int(nU) + 1 é uma variável aleatória uni- 

forme discreta em 1,...,n. 

5.6 Sua empresa deve enviar uma proposta 
lacrada para um projeto de construção. Se 
você ganhar o contrato (por fazer a pro- 
posta mais barata), você pretende pagar 
a uma outra firma 100 mil reais para que 
ela faça o serviço. Se você acredita que a 
menor oferta (em milhares de reais) das 
outras empresas participantes pode ser 
modelada como uma variável aleatória 
uniformemente distribuída em (70, 140), 
que proposta você deve fazer para maxi- 
mizar o seu lucro esperado? 

5.7 Para vencer certo jogo, você deve ganhar 
em três rodadas consecutivas. O jogo de- 
pende do valor de U, uma variável alea- 
tória uniforme no intervalo (0, 1).Se U > 
0,1, então você ganha a primeira rodada; 
se U > 0,2, então você ganha a segunda 
rodada;e se U > 0,3, você ganha a terceira 
rodada. 

(a) Determine a probabilidade de que 
você ganhe o primeiro jogo. 

(b) Determine a probabilidade condicio- 
nal de que você ganhe a segunda ro- 
dada dado que você tenha vencido a 
primeira rodada. 

(c) Determine a probabilidade condicio- 
nal de que você ganhe a terceira ro- 
dada dado que você tenha vencido as 
duas primeiras rodadas. 

(d) Determine a probabilidade de que 
você seja o vencedor do jogo. 

5.8 Um teste de QI de uma pessoa aleatoria- 
mente escolhida indica uma nota que é 
aproximadamente uma variável aleatória 
normal com média 100 e desvio padrão 
15. Qual é a probabilidade de que tal 
nota (a) esteja acima de 125; (b) entre 90 
e 110? 

5.9 Suponha que o tempo de viagem de sua 
casa ao seu escritório seja normalmente 
distribuído com média de 40 minutos e 
desvio padrão de 7 minutos. Se você quer 
estar 95% certo de que você não chegará 
atrasado para um compromisso no escri- 
tório às 13:00, qual é o último horário no 
qual você deverá sair de casa? 


5.10 O tempo de vida de certo tipo de pneu 


de automóvel é normalmente distribuído 

com média 34.000 km e desvio padrão de 

4.000 km. 

(a) Qual é a probabilidade de que esse 
pneu dure mais de 40.000 km? 

(b) Qual é a probabilidade de que ele 
dure entre 30.000 e 35.000 km? 

(c) Dado que ele tenha durado 30.000 km, 
qual é a probabilidade condicional de 
que ele dure 10.000 km a mais? 


5.11 O índice pluviométrico anual em Cleve- 


land, Ohio, é aproximadamente uma va- 

riável aleatória normal com média 1021 

mm e desvio padrão de 214 mm. Qual é a 

probabilidade de que 

(a) o índice pluviométrico do próximo 
ano exceda 1118 mm? 

(b) o índice pluviométrico anual em exa- 
tamente 3 dos próximos 7 anos exce- 
da 1118 mm? 

Suponha que, se 4, é o evento em que o 

índice pluviométrico excede 1118 mm em 

um ano (a partir de agora), então os even- 

tos 4, i = 1,são independentes. 


5.12 A tabela a seguir usa dados de 1992 refe- 


rentes ao percentual de homens e mulhe- 
res que trabalham o dia inteiro cujos salá- 
rios anuais caem em faixas diferentes: 


Percentual Percentual 
Faixa de salários de mulheres de homens 


=9999 8,6 4,4 
10.000-19.999 38,0 2 
20.000-24.999 19,4 15,8 
25.000-49.999 29,2 41,5 
= 50.000 4,8 17,2 


Suponha que amostras aleatórias de 200 

homens e 200 mulheres que trabalham o 

dia todo sejam escolhidas. Obtenha um 

valor aproximado para a probabilidade de 

que 

(a) pelo menos 70 das mulheres ganhe 
R$25.000 ou mais; 

(b) no máximo 60% dos homens ganhem 
R$25.000 ou mais; 

(c) pelo menos 3/4 dos homens e pelo 
menos metade das mulheres ganhem 
R$20.000 ou mais. 


5.13 Em certo banco, a quantidade de tempo 


que um cliente gasta em um caixa é uma 
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variável aleatória exponencial com mé- 
dia de 5 minutos. Se há um cliente sendo 
atendido quando você entra no banco, 
qual é a probabilidade de que ele ou ela 
continue no caixa 4 minutos depois? 


5.14 Suponha que a função distribuição cumula- 


tiva da variável aleatória X seja dada por 
FO)=1 — e? x>0 


Avalie (a) P(X >2):(b) PI <X<3):(c) 
a função taxa de risco de F; (d) ELX]; (e) 
Var(X). 

Dica: Para as letras (d) e (e), você pre- 
cisa utilizar os resultados do Exercício 
Teórico 5.5. 


5.15 O número de anos que uma máquina de 


lavar funciona é uma variável aleatória 
cuja função taxa de risco é dada por 


0,2 0O<t<2 
AD)=10,2+030—-2D) 2=1<5S 
11 t>sS 


(a) Qual é a probabilidade de que a má- 
quina continue a funcionar por 6 anos 
após a sua compra? 

(b) Se ela ainda estiver funcionando 6 
anos após a sua compra, qual é a pro- 
babilidade condicional de que ela es- 
trague nos próximos 2 anos. 


5.16 Uma variável aleatória de Cauchy padrão 


tem função densidade 
1 


fQ) = RE — 00 < X < 00 

Mostre que, se X é uma variável aleatória 
padrão de Cauchy, então 1/X também é 
uma variável aleatória padrão de Cauchy. 


5.17 Uma roleta tem 38 espaços, nos quais 


estão escritos os números 0,00 e 1 a 36; 
se você apostar 1 unidade em certo nú- 
mero, ganha 35 unidades se a bolinha cair 
naquele número, e perde 1 unidade caso 
contrário. Se você sempre faz apostas 
como essa, obtenha uma probabilidade 
aproximada para o evento em que 

(a) você ganha após 34 apostas; 

(b) você ganha após 1000 apostas; 

(c) você ganha após 100.000 apostas. 
Suponha que a bolinha da roleta tenha 
a mesma probabilidade de cair em qual- 
quer um dos espaços. 
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5.18 Há dois tipos de pilhas em uma cesta. 
Quando em uso, pilhas tipo i duram (em 
horas) um tempo exponencialmente distri- 
buído com taxa À, i = 1,2. Uma pilha reti- 
rada aleatoriamente da cesta tem probabi- 


lidade p, de ser do tipo i, onde E pi=1. 
Se uma bateria aleatoriamente E noihida 
continua a operar após i horas de uso, qual 
é a probabilidade de que ela continue a 
operar após s horas adicionais? 

5.19 Evidências a respeito da culpa ou inocên- 
cia de um réu em uma investigação crimi- 
nal podem ser resumidas pelo valor de uma 
variável aleatória X cuja média y depende 
da culpa do réu. Se ele é inocente, então u 
= 1;se ele é culpado, q = 2. O juiz conside- 
rará o réu culpado caso X > c para algum 
valor de c adequadamente escolhido. 


(a) Se o juiz quer estar 95% certo de que 
um homem inocente não seja conde- 
nado, qual deve ser o valor de c? 
(b) Usando o valor de c obtido na letra 
(a), qual é a probabilidade de que um 
réu culpado seja condenado? 
5.20 Para qualquer número real y, defina y* 
como 
+.) seyz0 
» = 0, sey < 0 


Seja c uma constante. 
(a) Mostre que 


1 2 
e c(1 
V2m 


quando Z é uma variável aleatória 
normal padrão. 

(b) Determine E[(X - c)*] quando X é 
normal com média u e variância o”. 


E((Z — )']= 


P(c)) 
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6.1 FUNÇÕES CONJUNTAMENTE DISTRIBUÍDAS 


Até agora, trabalhamos apenas com distribuições de probabilidade de uma úni- 
ca variável aleatória. Entretanto, com frequência estamos interessados em ana- 
lisar probabilidades de duas ou mais variáveis aleatórias. Nesse caso, definimos, 
para quaisquer variáveis aleatórias Xe Y,a função distribuição de probabilida- 
de cumulativa conjunta de X e Y como 


Fla,b)=P|X<a,Y=<b) -0<a,b<o 


A distribuição de X pode ser obtida a partir da distribuição conjunta de X e Y 
da seguinte maneira: 


Fx(a)=P(X <a) 
=P(X <a,Y < co) 


si lim(X=aY = ») 
b-—>00 
= lm PX <aY =b) 
b> 00 
= lim F(a,b) 
b—> 00 
= F(a,00) 
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Note que, nesse conjunto de igualdades, fizemos uso uma vez mais do fato de 
que a probabilidade é uma função contínua de um conjunto (isto é, evento). 
Similarmente, a função distribuição cumulativa de Y é dada por 


Fy(b) = P(Y = b) 
= im ab) 
= F(c0,b) 


As funções distribuição F, e F, são às vezes chamadas de distribuições margi- 
nais de Xe Y. 

Tudo o que se deseja saber sobre as probabilidades conjuntas de Xe Y 
pode, em tese, ser respondido em termos de sua função distribuição conjun- 
ta. Por exemplo, suponha que queiramos calcular a probabilidade conjunta 
de que X seja maior que a, e Y, maior que b. Isso poderia ser feito como a 
seguir 
PX >aY>b)=1-Pd4X>aY > bb 

=1-P4X>a uy > bd) 
=1-P(X<=agJU(Y=b) 
=1-[PX<a)+PY=<=b)-PX=<aY=<ob)] 
=1 — Fy(a) — Fy(b) + F(a,b) (1.1) 
A Equação (1.1) é um caso especial da equação a seguir, cuja verificação é dei- 
xada como exercício: 
Pla <X<a,by<Y=<b) 
= F(az,b2) + F(a,by) — Flay,bo) — F(ao,b1) (1.2) 
sempre que a, <a,,b, < b,. 
No caso em que X e Y são variáveis aleatórias discretas, é conveniente de- 


finir a função discreta de probabilidade conjunta (ou simplesmente função de 
probabilidade conjunta) de X e Y como 


prxy)=PMX=x,Y=y) 


A função de probabilidade de X pode ser obtida de p(x, y) por: 
px0) = PIX =x) 


= >, PG) 


y:p(x,y)>0 
Similarmente, 
p= > px) 
x:p(x,y)>0 
Exemplo 1a 


Suponha que 3 bolas sejam sorteadas de uma urna contendo 3 bolas vermelhas, 
4 bolas brancas e 5 bolas azuis. Se X e Y representam, respectivamente, o nú- 


Occ Occ Occ oc 


(f = Ald = eunjoo ep emos 


ozz 

I I 
ozz 
LT 
ozz 
soL 
oz 
+8 


U = Xld = eu ep emos 


U=At=xid 19 epqer 


onb ojuenbus 'sequiy sep euros e os-opuepnopeo epigo 9 x op opepiriqegord 
ap ogôung e onb IPAISSgO 9A9Pp IOJI9] O 'T'9 BI2qeI eu ouroo “ejaqey eum 
9Pp BÚLIOoj BU 9juotueIP|o sieui sepejuosoIde 19s uropod sopepirqegord sessg 


= (a)/(6)(g)-cma 
me) nar 
ata) =tena 

6 (a)/(6)()(g)-ava 
(a )/ (E) ame 
Pe(a)/(5)-com 

e (a)/(5)(5)- cos 
RM jets 
= (6)/(5)= 0a 
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a função de probabilidade de Y é obtida calculando-se a soma das colunas. 
Como as funções de probabilidade individuais de X e Y aparecem na mar- 
gem da tabela, elas são muitas vezes chamadas de funções de probabilidade 
marginais de X e Y, respectivamente, ms 


Exemplo 1b 


Suponha que 15% das famílias de certa comunidade não tenham filhos, 20% 
tenham 1 filho, 35% tenham 2 filhos e 30% tenham 3. Suponha também que, 
em cada família, cada filho tenha a mesma probabilidade (independente) de 
ser menino ou menina. Se uma família dessa comunidade é escolhida aleatoria- 
mente, então B, o número de meninos, e G, o número de meninas nesta família, 
terão a função de probabilidade conjunta mostrada na Tabela 6.2. 
As probabilidades mostradas na Tabela 6.2 são obtidas da maneira a seguir: 
P(B = 0,G = 0) = Plfamília sem filhos) = 0,15 
P(B = 0,G = 1) = P(família com 1 menina e um total de 1 filho) 


1 
= P(1 filhojP(1 meninal1 filho) = (0,20) (5) 
P(B = 0,G = 2) = P(família com 2 meninas e um total de 2 filhos] 
2 
= P(p filhos) P(2 meninas? filhos) = (0,35) (5) 
Deixamos a verificação das demais probabilidades na tabela para o leitor. E 


Dizemos que X e Y são conjuntamente contínuas se existir uma função f(x,y), 
definida para todos os x e y reais, com a probabilidade de que, para todo conjunto 
C de pares de números reais (isto é, C é um conjunto no plano bidimensional), 


PA, E C)= / Ieyldrdy 
(eyjec (1.3) 


A função f(x, y) é chamada de função densidade de probabilidade conjunia 
de Xe Y.Se Ae B são quaisquer conjuntos de números reais, então, definin- 
doC=[(x,y):x€E A4,y E B), vemos da Equação (1.3) que 


pe A veB)= | | foy)drdy 
BVJA 


(1.4) 
Tabela 6.2 MB=,G=) 
A) 1 2 3 Soma da linha = P(B = à) 
0 0,15 0,10 00875  0,0375 0,3750 
1 0,10 0,175 01125 O 0,3875 
2 0,0875 0,1125 (0) 0 0,2000 
3 0,035 O 0 0 0,0375 


Soma da coluna = P(G=j] 0,3750 0,387 02000 0,375 
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Como 
F(a,b) — P(X E (-00,a],Y € (—00,b]) 


b a 
À ftp) drdy 


vemos, calculando as derivadas, que 


o 
f(a,b) = 34967 (4 b) 


sempre que as derivadas parciais forem definidas. Outra interpretação da fun- 
ção densidade conjunta, obtida da Equação (1.4), é 


d+db parda 
Pla<X<a+ da,b < Y <b+abj= [ Ê flw,ydxdy 
b a 
= f(a,b) da db 


onde da e db são pequenos e f(x, y) é contínua em a, b. Com isso, f(a, b) é uma 
medida de quão provável é a presença do vetor aleatório (X, Y) na vizinhança 
de (a, b). 

Se Xe Y são variáveis aleatórias conjuntamente contínuas, elas são indi- 
vidualmente contínuas, e suas funções densidade de probabilidade podem ser 
obtidas da seguinte maneira: 


P(X e A])=P(XEA,Y E (-00,00)) 


-[ [tanara 


= ) fx (x) dx 
A 
onde 
fx) = f(x,y) dy 


é portanto a função densidade de probabilidade de X. Similarmente, a função 
densidade de probabilidade de Y é dada por 


hro=[ fade 


Exemplo 1c 
A função densidade conjunta de X e Y é dada por 


FO) = 


a XD 0QO<x<o,0<y<o 
caso contrário 


Calcule (a) PiX>1,Y<I,(bD PX<Ye(co)P|X< al. 
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Solução (a) 
1 poo 
PSY E D=[ i 20 e» dxdy 
o J1 
1 
E) —x |oo 
= [ 2e > (-e Ii) ay 


1 
= a 2 dy 
0 


= eta — e?) 
(b) 
P(X <Y)= / 20 “e dxdy 
(y)x<y 
oo py 
- [ / 2e€ e V dxdy 
o Jo 
oo 
= / 20 (1 — eNdy 
oa [0,6] 
- [ 20 Vdy -| 2e dy 
0 0 
2 
=1-5 
EA 
ea 
(c) 
a [9,6] 
P(X < a) - [ / 2e Ve* dy dx 
o Jo 
a 
- [ e*dx 
0 
=1-€e7? 
Exemplo Id 


Considere um círculo de raio R e suponha que um ponto em seu interior seja 
escolhido aleatoriamente de maneira tal que todas as regiões do círculo tenham 
a mesma probabilidade de conter esse ponto (em outras palavras, o ponto está 
uniformemente distribuído no interior do círculo). Se o centro do círculo está 
na origem do sistema de coordenadas, e X e Y correspondem às coordenadas 
do ponto escolhido (Figura 6.1), então, como (X, Y) tem a mesma probabili- 
dade de estar na vizinhança de qualquer ponto no círculo, a função densidade 


conjunta de X e Y é dada por 
csex +y=<R 


x,y) = 
oa na 
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Figura 6.1 Distribuição de probabilidade conjunta. 


para algum valor de c. 


(a) Determine c. 

(b) Determine as funções densidade marginais de X e Y. 

(c) Calcule a probabilidade de que D, a distância da origem ao ponto selecio- 
nado, seja menor ou igual a a. 

(d) Determine E[D). 


Solução (a) Como 


[0,6] oo 
É fxydydx=1 
—00 J/ —OO 


tem-se que 
c / / dydx=1 
x2+y2<R2 


Podemos calcular ff, +y2=R? dy dx usando coordenadas polares ou, mais sim- 

plesmente, notando que essa função representa a área do círculo, que é igual a 
2 a 

mR'. Com isso, 


e 1 
— nR 


(b) 


Bios A fl) dy 


1 
=——s d 
xR2 iai é 


1 c 
-=/ dy, ondec=vR? — x? 
—c 
2 
=D VR -x d=R? 


— nR? 
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e essa expressão é igual a 0 quando x” > Rº. Por simetria, a densidade marginal 
de Y é dada por 


2 
fr) =, o R? — y? y < R 
=0 PR 


(c) A função distribuição de D = VX2 + Y2,a distância a partir da origem, é 
obtida como a seguir:para0 = a =R, 


Fo()=PVX?+Y2 <a) 


=PXº + Y2=<9) 
- |f tapáa 


x2+y2<a? 


1 


x2+y2=g? 


xa? 


“aR 


“R 


onde usamos o fato de que /[,2,,2<» dy dx representa a área de um círculo de 


+y 
E 2. 2 
raio a, que é igual a ga”. 


(d) Da letra (c), a função densidade de D é 


2a 
fla) = a 0O<=asR 
Portanto, 
2. [é 2R 
EID] = — eds == 
[DJ = | Pda=S A 
Exemplo te 


A função densidade de X e Y é dada por 


fue e) )<x<00,0<y<o 
Vo caso contrário 


Determine a função densidade da variável aleatória X/Y. 
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Solução Começamos calculando a função distribuição de X/Y. Para a > 0. 


X 
Fxpyv(a) -Piy < a) 


= ff e CA) dx dy 


x/y<a 


co pay 
- [ À e dxdy 
0 0 
oo 
= A-eNVedy 
0 
[9,0] 
e (+Dy 
= e”) + 
a+1 
0 
1 
a+1 


ES us 


Se calcularmos a derivada dessa função, mostramos que a função densidade 
de X/Y é fua) = Ma +17,0<a< o. E 


Também podemos definir funções distribuição de probabilidade conjunta 
para n variáveis da mesma maneira como fizemos para n = 2. Por exemplo, a 
função distribuição de probabilidade conjunta F(a,, a,,..., a,) das n variáveis 
aleatórias X,, X,,..., X, é definida como 


Fa,a,..a)- PX <a,Ã,<a,..,X <a, 


Além disso, as n variáveis aleatórias são chamadas de conjuntamente contínuas 
se existir uma função f(x,, x,,..., x,), chamada de função densidade de probabili- 
dade conjunta, tal que, para qualquer conjunto € no n-espaço, 


PIX1,X2,...,Xm) EC) = ff toa... manda dao 
(x1,... Xn)EC 


Em particular, para quaisquer n conjuntos de números reais 4,, 4,,...,4,. 
P(X, E Ar, Ão,€ Ao,.. ; XX e An) 


- | ) n. fOa,...,Xn) dedxo --- dx, 
n An-1 Ai 


Exemplo 1f A distribuição multinomial 

Uma das mais importantes distribuições conjuntas é a distribuição multinomial, 
que surge quando uma sequência de n experimentos independentes e idênticos 
é realizada. Suponha que cada experimento possa levar a qualquer um de r 
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a 
resultados possíveis, com respectivas probabilidades p,,P,,....D, ) pi 1. Se X, 
i=1 
representa o número de experimentos que levam ao resultado i, então 
n! 


= = = = á n1 hz nr 
PE o 1? 1 P, “Pr 


(1.5) 
Fr 
sempre que 3: n;=n. 
i=1 

A Equação (1.5) é verificada notando-se que a sequência de resultados dos 
n experimentos que leva à ocorrência do resultado i um total de n, vezes para 
i = 1,2,...,r tem, pela hipótese de independência dos experimentos, probabili- 
dade de ocorrência Do p5... pr”. Como existem n!/(n,!n,!... n,!) sequências de 
resultados assim (existem n!/n,!...n,! diferentes permutações de n coisas das 
quais n, são do mesmo tipo, n, são do mesmo tipo...., n, são do mesmo tipo), 
estabelece-se a Equação (1.5). A distribuição conjunta cuja função discreta de 
probabilidade conjunta é especificada pela Equação (1.5) é chamada de distri- 
buição multinomial. Note que, quando r = 2, distribuição uno reduz- 
se para a distribuição binomial. 

Note também que qualquer soma de um conjunto fixo de X;s tem dis- 
tribuição binomial. Isto é, se N C (1,2...., r], então 3:,.y X; é uma variável 
aleatória binomial com parâmetros n e p = >;en Pi Isso é obtido porque 
Xien Xi representa o número de n experimentos cujo resultado está em N, 
e cada experimento leva independentemente a um resultado como esse com 
probabilidade 3",cy Pi. 

Como uma aplicação da distribuição multinomial, suponha que um dado 
honesto seja rolado 9 vezes. A probabilidade de que o 1 apareça três vezes, o 
2eo3 apareçam duas vezes cada, e o 4e o 5 apareçam 1 vez cada, e o 6 não 
apareça nenhuma vez é dada por 


samimo (6) (5) (6) (6) (6) (6) = (o) a 


6.2 VARIÁVEIS ALEATÓRIAS INDEPENDENTES 


As variáveis aleatórias X e Y são independentes se, para quaisquer dois conjun- 
tos de números reais 4 e B, 


PIXEA,YEB)=PXEA)P|YEB) (2.1) 


Em outras palavras, X e Y são independentes se, para todo A e B, os eventos 
E, = (Xe AleF,=(Y€ B)forem independentes. 

Pode-se mostrar, usando-se os três axiomas da probabilidade, que a Equa- 
ção (2.1) é obtida se e somente se, para todo a, b, 


PlX<=aY=b)=PX=aP|Y=b) 
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Portanto, em termos da função distribuição conjunta F de Xe Y, Xe Y são 
independentes se 


F(a,b) = Fa)F Ab) para todo a,b 


Quando X e Y são variáveis aleatórias discretas, a condição de independência 
(2.1) é equivalente a 


p(x,y) = pyulx)pyly). para todo x,y (2.2) 


Tem-se essa equivalência porque, se a Equação (2.1) é satisfeita, então obtemos 
a Equação (2.2) fazendo com que A e B sejam, respectivamente, os conjuntos 
unitários A = [x)e B = (y). Além disso, se a Equação (2.2) é válida, então, para 
quaisquer conjuntos A, B, 


PIXEAYEB =) 5 pe) 


yeBxeA 


=5 ,) ,px0pr0) 


yeB xeA 


=3 py) px(9 


yeB xEA 
=P(YeB)PXeA) 


e a Equação (2.1) é estabelecida. 
No caso conjuntamente contínuo, a condição de independência é equiva- 
lente a 


fox, y) = Le)fv0) para todo x,y 


Assim, de maneira informal, X e Y são independentes se o conhecimento 
do valor de um não mudar a distribuição do outro. Variáveis aleatórias que não 
são independentes são chamadas de dependentes. 


Exemplo 2a 


Suponha que n + m tentativas independentes com probabilidade comum de 
sucesso p sejam realizadas. Se X é o número de sucessos nas primeiras n tenta- 
tivas e Y é o número de sucessos nas m tentativas finais, então X e Y são inde- 
pendentes, já que o conhecimento do número de sucessos nas primeiras tentati- 
vas não afeta a distribuição do número de sucessos nas m tentativas finais (pela 
hipótese de tentativas independentes). De fato, para x e y inteiros, 


<x 
0=y 


IA IA 
Is 


Px =sy=n=(1 pa pr ( pra — pro 
=PX =mP(Y =) 


Por outro lado, X e Z são dependentes, onde Z é o número total de sucessos em 
n + m tentativas. (Por quê?) = 
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Exemplo 2b 


Suponha que o número de pessoas que entram em uma agência de correio em 
certo dia seja uma variável aleatória de Poisson com parâmetro À. Mostre que, 
se cada pessoa que entra na agência de correio for homem com probabilidade 
p e mulher com probabilidade 1 — p, então pode-se representar o número de 
homens e mulheres entrando na agência por variáveis aleatórias de Poisson 


com respectivos parâmetros Ap e A(1 — p). 


Solução Suponha que X e Y representem, respectivamente, o número de 
homens e mulheres que entram na agência de correios. Vamos demonstrar a 
independência de X e Y estabelecendo a Equação (2.2). Para obtermos uma 
expressão para P(X = i, Y = j), condicionamos em X + Y da maneira a seguir: 


PX=iY=j=PX=,Y=jX+Y=i+JPX+Y=i+) 


+PX=,Y=X+YHi+JPX+YAHi+j 


[Note que essa equação é meramente um caso especial da fórmula P(E) = P(EIF) 


P(F) + P(EIF9P(F)). 
Como P[X =;,Y=jjX+Yi+;) é claramente 0, obtemos 


PlX=iY=jj=PX=LY=X+Y=i+JPX+Y=i+j) (23) 


Agora, como X + Y é o número total de pessoas que entram na agência de 


correios, tem-se, por hipótese, que 
E ati 
(i + D! 


P(X+Y=i+t+jj=e 


(2.4) 


Além disso, dado que i + j pessoas entrem na agência de correios, como cada 
pessoa que entra tem probabilidade p de ser homem, tem-se que a probabili- 
dade de que exatamente i dessas pessoas sejam homens (e portanto j sejam 


+] 


mulheres) é somente a probabilidade binomial ( i 


PlX=iv=jX+ r=1+0=(" Pra =p) 


A substituição das Equações (2.4) e (2.5) na Equação (2.3) resulta em 


. : + jdyoi DR id 
PX=iY=jj= ( * pia — pje = ii 
Ap) 
=e*+ a pa -— pm 
= Op! apa — PY 
it n 


Assim, 


P(X = ij Es EP Cm ea Aq a: DF ne EP Ca 
1 


) pi — p) Isto é, 


(2.5) 


(2.6) 


(2.7) 
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e similarmente 


= eMI-p) pa — pp 


da j! (2.8) 


As Equações (2.6), (2.7) e (2.8) estabelecem o resultado desejado. = 


Exemplo 2c 

Um homem e uma mulher decidem se encontrar em certo lugar. Se cada um 
deles chega independentemente em um tempo uniformemente distribuído en- 
tre 12:00 e 13:00, determine a probabilidade de que o primeiro a chegar tenha 
que esperar mais de 10 minutos. 


Solução Se Xe Y representam, respectivamente, o tempo após o meio-dia 
em que chegam o homem e a mulher, então X e Y são variáveis aleatórias inde- 
pendentes, cada uma uniformemente distribuída no intervalo (0, 60). A proba- 
bilidade desejada, P(X + 10 < Y)] + P(Y + 10 < X), que, por simetria, é igual a 
2P(X + 10< Y), é obtida da seguinte maneira: 


2P(X +10 < Y)=2 IH) f(x,y) dxdy 
x+10<y 


-2 f / feCfr0) dxdy 


x+10<y 


60 py-10/ 1412 
10 Jo 60 dá 


2 60 


2 
"36 = 


Nosso próximo exemplo apresenta o mais antigo problema relacionado a 
probabilidades geométricas. Ele foi analisado e resolvido pela primeira vez por 
Buffon, um naturalista francês do século dezoito. Por esse motivo, é usualmente 
chamado de problema da agulha de Buffon. 


Exemplo 2d Problema da agulha de Buffon 


Uma tábua é graduada com linhas paralelas com espaçamento D entre si. Uma 
agulha de comprimento L, onde L = D, é jogada aleatoriamente sobre a mesa. 
Qual é a probabilidade de que a agulha intercepte uma das linhas (sendo a 
outra possibilidade a de que a agulha fique completamente contida no espaço 
existente entre as linhas)? 


Solução Vamos determinar a posição da agulha especificando (1) a distância 
X do ponto central da agulha até a linha paralela mais próxima e (2) o ângulo 
6 entre a agulha e a linha de comprimento X indicada na Figura 6.2. A agulha 


296 Probabilidade: Um Curso Moderno com Aplicações 


interceptará uma linha se a hipotenusa do triângulo reto na Figura 6.2 for me- 
nor que L/2 — isto é, se 


L L 
== — o X < —cosô 
cos 8 = 2 2 


Como X varia entre 0 e D/2 e 6 varia entre O e 7/2, é razoável supor que essas 
variáveis aleatórias sejam independentes e uniformemente distribuídas ao lon- 
go de seus respectivos intervalos. Com isso, 


pfx < 5 cos0] = IH) fx 0)fo (0) dx dy 


x<L/2cosy 


4 n/2 pL/2cosy 
Es dx d, 
=D |, Há ea 


co cd 
“aD / Ra did 
2L 
xD E 
*Exemplo 2e Caracterização da distribuição normal 


Suponha que X e Y representem as distâncias de erro horizontal e vertical 
quando uma bala é disparada contra um alvo, e suponha que 


1. Xe Y sejam variáveis aleatórias independentes contínuas com funções 
densidade deriváveis. 

2. A densidade conjunta f(x,y) = f(x)fy) de X e Y depende de (x,y) so- 
mente através de x” + y?. 


De maneira informal, a hipótese 2 diz que a probabilidade da bala acertar 
qualquer ponto no plano x-y depende somente da distância do ponto até o 
alvo e não de seu ângulo de orientação. Uma maneira equivalente de enun- 
ciar essa hipótese é dizer que a função densidade conjunta é invariante com 
a rotação. 

É bastante interessante o fato de as hipóteses 1 e 2 implicarem X e Y como 
sendo variáveis aleatórias normalmente distribuídas. Para demonstrar isso, note 
primeiro que as hipóteses levam à relação 


Toy) = LOIO) = 86º + 3) (2.9) 


Figura 6.2 
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para alguma função g. Derivando-se a Equação (2.9) em relação a x, obtém-se 
PAPA) = 2xg' (º + 9 (2.10) 
Dividir a Equação (2.10) pela Equação (2.9) resulta em 


Fe) 2g (2 + y?) 
O go +y) 


ou 


HO go +y) 
Zxfx0) go? + y2) 


(211) 


Como o valor do lado esquerdo da Equação (2.11) depende somente de 
x, enquanto o valor do lado direito depende de x” + y”, tem-se como resultado 
que o lado esquerdo deve ser o mesmo para todo x. Para ver isso, considere 
quaisquer x,, x, e escolha y,, y, de forma que x? + yZ =x5 + y3. Então, da 
Equação (2.11), obtemos 


fon) ge +D E 05 +) fan) 
Zajxo) gui +ry) gaz +) Lofxlo) 


Portanto, 


Ato E 
xfx0) 


ou À dogfx (9) = cx 
dx 


o que implica, com a integração de ambos os lados, que 


cx? 2,2 
log fx (1) = a + OU fx 00) = ke! 


Como Po fx(x) dx = 1, então c é necessariamente negativo. Com isso, pode- 
2 . 
mos escrever c = — 1/0". Assim, 


fe(x) = ke Po? 


Isto é, X é uma variável aleatória normal com parâmetros u = 0 e o”. Um argu- 
mento parecido pode ser aplicado a f,(y) para mostrar que 


1 2,972 
v() = — meo 
Rey, 2x 6 


4 : 104 2 — = 22 : 
Além disso, resulta da hipótese 2 que o” = 52 e que X e Y são portanto variáveis 
aleatórias normais identicamente distribuídas com parâmetros uy = 0e o”. E 


Uma condição necessária e suficiente para que as variáveis aleatórias X e 
Y sejam independentes é a de que sua função densidade de probabilidade con- 
junta (ou função de probabilidade conjunta no caso discreto) f(x, y) possa ser 
fatorada em dois termos, um dependendo somente de x e o outro dependendo 
somente de y. 
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Proposição 2.1 As variáveis contínuas (discretas) X e Y são independentes se 
e somente se sua função densidade de probabilidade conjunta (ou discreta de 
probabilidade conjunta) puder ser escrita como 


Pela, y) = h(x)g(x) —0<x<0%0,—0<y<c 


Demonstração Vamos demonstrar o caso contínuo. Primeiramente, note 
que a independência implica o fato da densidade conjunta ser o produto das 
densidades marginais de X e Y. Com isso, a fatoração anterior é verdadeira 
quando as variáveis aleatórias são independentes. Agora, suponha que 


Feslx,y) = hO)gl) 


Então, 


pd Il fx,y(x,)) dx dy 


= f h(x) dx / gg) dy 
=CGG 


onde C, = [Coh(gy)dxeC = [E 86) dy. Também, 
fx0) = h fxy 0,7) dy = Cah) 


fr) = ! fe vi, dr = Gg) 


Como €,C, = 1, obtemos 


Perl y) = SOFA) 


e a demonstração está completa. [ 


Exemplo 2f 
Se a função densidade conjunta de X e Y é 


x,y)=62e”naregiãoO<x<0,0<y<o 
y E y 


e é igual a O fora dessa região, são as variáveis aleatórias independentes? E se a 
função densidade conjunta é 


f(x,y) = 24xy naregiãoO<x<1,0<y<1,0<x+y<1 
e é igual a () caso contrário? 


Solução No primeiro caso, a função densidade conjunta pode ser fatorada, 
e portanto as variáveis aleatórias são independentes (uma é exponencial com 
taxa 2 e a outra é exponencial com taxa 3). No segundo caso, como a região 
em que a densidade conjunta é diferente de zero não pode ser escrita na for- 
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max € 4,y € B,a densidade conjunta não pode ser fatorada. Com isso, as 
variáveis aleatórias não são independentes. Isso pode ser visto claramente se 
fizermos 


“Ji se0O<x<1l,0<y<1l,0<x+y<1 
TG) = | O caso contrário 


e escrevermos 


fx, y) = 24xy Kx,y) 


o que claramente não pode ser fatorado em um termo que depende somente de 
x e em outro que depende somente de y. E 


O conceito de independência pode, naturalmente, ser definido para mais 
de duas variáveis aleatórias. Em geral, as n variáveis aleatórias X,, X,,..., X, são 
independentes se, para todos os conjuntos de números reais 4,, 4,,..., A,» 


n 
P(X, E A, X2 E A2,...,Xn E An) = [rox e Ai) 


i=1 


Como antes, pode-se mostrar que essa condição é equivalente a 


n 
PX <a,X<a,.,X,<a)=][PIX; <= ailparatodoa, a,,...,a, 
i=1 
Finalmente, dizemos que uma coleção infinita de variáveis aleatórias é inde- 
pendente se cada uma de suas subcoleções finitas for independente. 


Exemplo 2g 


A maioria dos computadores é capaz de gerar, ou simular, o valor de uma variá- 
vel aleatória uniforme no intervalo (0,1) por meio de uma sub-rotina residente 
que (com certa aproximação) produz tais “números aleatórios”? Como resultado, 
é muito fácil para um computador simular uma variável aleatória indicadora 
(isto é, de Bernoulli). Suponha que 7 seja uma variável indicadora tal que 


PU=1]=p=1-P(=0) 


O computador pode simular 7 sorteando um número aleatório U no intervalo 
(0,1) e então fazendo 


IseU <p 


= 0seU=>p 


Suponha que estejamos interessados em que o computador selecione k, k = n, 


dos números 1,2,...,n de forma tal que cada um dos subconjuntos ( : ) de ta- 


manho k tenha a mesma probabilidade de ser escolhido. Agora, apresentamos 
um método que permitirá ao computador resolver essa tarefa. Para gerar um 
subconjunto como esse, vamos primeiro simular, em sequência, n variáveis in- 


300 Probabilidade: Um Curso Moderno com Aplicações 


dicadoras 4, L,..., 1,, das quais exatamente k são iguais a 1. Os valores de i para 
os quais 1, = 1 vão então constituir o subconjunto desejado. 
Para gerar as variáveis aleatórias [,..., 1, comece simulando n variáveis 


aleatórias uniformes independentes U,, U,,..., U,. Definimos agora 


k 
Re 1 et 


O caso contrário 


e então, assim que Z,...., 1, forem determinados, ajustamos recursivamente 


k-— (1 fez des 5 
1 se Ui < (h + a do 
ln = n-i 
O caso contrário 


Colocando em palavras, na (i + 1)-ésima etapa fazemos [,,, igual a 1 (e então 
colocamos i + 1 no subconjunto desejado) com probabilidade igual ao número 
i 
restante de vagas no subconjunto | isto é,k — 5 1; |, dividido pelo número de 
j=1 
possibilidades restantes (isto é,n — i). Com isso, a distribuição de probabilidade 
conjunta de 1,, L,..., 1, é determinada a partir de 


Ph=1)=É 
n 
i 
k- 55 
Pla = Uh, ...dij= E I<i<n 


A demonstração de que a última fórmula resulta em que todos subcon- 
juntos de tamanho k tenham a mesma probabilidade de serem escolhidos é 
feita por indução em k + n. Ela é imediata quando k + n = 2 (isto é, quando 
k = 1,n = 1), então suponha que ela seja verdade sempre que k + n = 1. 
Agora, suponha que k + n = 1 + 1 e considere qualquer subconjunto de ta- 
manho k — digamos, i <= à, = ---: = i,— e considere os dois casos a seguir. 


Casol: i=1 
Ph =h,=-=h,=1,1;=0 caso contrário) 
=P(h=DP(l,=- =, =1,1];=0 caso contráriolh = 1) 


Agora, dado que 1, = 1, os elementos restantes do subconjunto são esco- 
lhidos como se um subconjunto de tamanho k — 1 tivesse que ser escolhido a 
partir dos n — 1 elementos 2,3,...,n. Portanto, pela hipótese de indução, a proba- 


Capítulo 6 * Variáveis Aleatórias Conjuntamente Distribuídas 301 


bilidade condicional de que isso resulte na seleção de um dado subconjunto de 
n-1 


tamanho k — 1 é iguala 1/ a . Com isso, 
Ph =1l,=:--=1h,=1,1;=0 caso contrário) 
ok 1 | 
nn =<L) fn 
k-—-1 k 
Caso2: i,%1 
Pl, = 1, =: == 1,1; =0 caso contrário) 
=P(l, ==, =1,1,=0 caso contráriolh = OJP(h = 0) 


REC No 


onde a hipótese de indução foi usada para avaliar a probabilidade condicional 
anterior. 
Assim, em todos os casos, a probabilidade de que um dado subconjunto de 


tamanho k seja o subconjunto escolhido é igual a u( : ) = 


Observação: O método anterior para gerar um subconjunto aleatório re- 
quer muito pouca memória. Um algoritmo mais rápido que requer um pouco 
mais de memória é apresentado na Seção 10.1 (este usa os últimos k elementos 
de uma permutação aleatória de 1,2.,...,n). E 


Exemplo 2h 


Sejam X, Y, Z variáveis aleatórias independentes e uniformemente distribuídas 
ao longo de (0,1). Calcule P[X = YZ). 


Solução Como 
Fey y,2) = OO) =1 0=x=1,0=y=1,057=1 


temos 


PX = YZ)= / / fev 266,7.) dxdy da 


xyz 
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Exemplo 2i Interpretação probabilística do tempo de meia-vida 


Suponha que N(t) represente o número de núcleos contidos em uma massa de 
material radioativo no instante de tempo t. O conceito de tempo de meia-vida é 
muitas vezes definido de uma maneira determinística com o argumento empíri- 
co de que, para algum valor A, chamado de tempo de meia-vida, 


NO =2"ÊN(O) t>0 


[Observe que N(h) = N(0)/2.] Como o resultado anterior implica que, para 
qualquer s e t não negativos, 


N(t + s) = 2 C'YN(O) = 27“ N(s) 


tem-se que, independentemente do tempo s já decorrido, em um tempo adicio- 
nal t o número de núcleos existentes decairá de acordo com o fator 2”. 

Como a relação determinística acima resulta de observações de massas 
radioativas contendo números imensos de núcleos, ela parece ser consistente 
com uma interpretação probabilística. A dica para deduzir-se o modelo pro- 
babilístico apropriado para o tempo de meia-vida reside na observação empí- 
rica de que a proporção de decaimento em qualquer intervalo de tempo não 
depende nem do número de núcleos no início desse intervalo nem do instante 
de início desse intervalo (já que N(t + s)/N(s) não depende nem de N(s), nem 
de s). Assim, parece que cada núcleo age independentemente e de acordo com 
uma distribuição de tempo de vida sem memória. Consequentemente, como 
a distribuição exponencial é a única que possui a propriedade de ausência de 
memória, e como exatamente metade de uma dada quantidade de massa decai 
a cada h unidades de tempo, propomos o seguinte modelo probabilístico para 
o decaimento radioativo. 


Interpretação probabilística do tempo de meia-vida h: Os tempos de vida dos 
núcleos individuais são variáveis aleatórias independentes com distribuição ex- 
ponencial de mediana A. Isto é, se L representa o tempo de vida de um dado 
núcleo, então 


PLA ]=1=2" 
(Como PÍL < h] = i e a equação anterior pode ser escrita como 


P(L<t=1-— exp [E 
pode-se ver que L tem de fato distribuição exponencial com mediana A.) 

Note que, de acordo com a interpretação probabilística fornecida, se come- 
çamos com N(0) núcleos no tempo 0, então N(t), o número de núcleos que per- 
manecem no tempo t+, terão distribuição binomial com parâmetros n = N(0) e 
p = 2". Resultados do Capítulo 8 mostrarão que essa interpretação do tempo 
de meia-vida é consistente com o modelo determinístico quando se considera a 
proporção de um grande número de núcleos que decaem ao longo de um dado 
intervalo de tempo. Entretanto, a diferença entre as interpretações determinís- 
tica e probabilística fica clara quando se considera o número real de núcleos 
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que sofreram decaimento. Vamos agora indicar isso considerando a questão do 
decaimento ou não de prótons. 

Há alguma controvérsia quanto ao fato de prótons decaírem ou não. De 
fato, uma teoria prediz que prótons decaem com um tempo de meia-vida da 
ordem de h = 10º anos. Para verificar essa predição empiricamente, sugeriu-se 
que um grande número de prótons fosse monitorado ao longo de, digamos, um 
ou dois anos, de forma a observar-se a ocorrência de qualquer decaimento ao 
longo deste período (claramente, não seria possível monitorar uma massa de 
prótons por 10” anos para ver se metade dela terá decaído). Vamos supor que 
possamos a monitorar N(0) = 10” prótons por c anos. O número de decaimen- 
tos predito pelo modelo determinístico seria então dado por 


N(O) — N() = h(1 — 27h) 


e 9-clh 
“1h 
9-0 
x lim este omGa = 102 = 0 
x>0 X 


] 


lim (c27*log2) pela regra de L'Hôpital 
x>0 
= clog2 = 0,6931c 


Por exemplo, o modelo determinístico prediz que em 2 anos deverão ocorrer 
1,3863 decaimentos. De fato, seria uma grande falha para o modelo de decai- 
mento de prótons proposto se nenhum decaimento fosse observado ao longo 
desses 2 anos. 

Vamos agora contrastar as conclusões que acabamos de obter com aquelas 
obtidas com o modelo probabilístico. Novamente, vamos considerar a hipótese 
de que o tempo de meia-vida dos prótons seja de h = 10” anos, e supor que 
monitoremos h prótons por c anos. Como há um número enorme de prótons 
independentes, cada um deles com probabilidade muito pequena de decair ao 
longo deste período de tempo, tem-se que o número de prótons que apresen- 
tam decaimento tem (com uma aproximação muito boa) uma distribuição de 
Poisson com parâmetro A(1 - 2") = c log2. Assim, 


P(0 decaimentos) = emclog2 
todo = E 
e, em geral, 
Pin decaimentos) = 2 C[clog 2)" Sah 


n! 


Assim vemos que, muito embora o número médio de decaimentos ao longo 
de 2 anos seja (conforme predito pelo modelo determinístico) de 1,3863, há 
1 chance em 4 de que não ocorram quaisquer decaimentos. Este resultado de 
forma alguma invalida a hipótese original do decaimento de prótons. n 


304 Probabilidade: Um Curso Moderno com Aplicações 


Observação: Independência é uma relação simétrica. As variáveis aleató- 
rias Xe Y são independentes se sua função densidade conjunta (ou função de 
probabilidade conjunta, no caso discreto) é o produto de suas funções densi- 
dade (ou de probabilidade) individuais. Portanto, dizer que X é independente 
de Y é equivalente a dizer que Y é independente de X — ou somente que X e 
Y são independentes. Como resultado, ao considerar se X é independente ou 
não de Y em situações em que não é intuitivo saber que o valor de Y não muda 
as probabilidades relacionadas a X, pode ser útil inverter os papéis de X eY e 
perguntar se Y é independente de X. O próximo exemplo ilustra este ponto. 


Exemplo 2j 


Se o primeiro resultado obtido em um jogo de dados resultar na soma dos da- 
dos ser igual a 4, então o jogador continua a jogar os dados até que a soma dê 4 
ou 7 Se a soma der 4, então o jogador vence; se der 7 ele perde. Suponha que N 
represente o número de jogadas necessárias até que a soma seja 7 ou 4,e que X 
represente o valor (4 ou 7) da jogada final. N é independente de X? Isto é, saber 
se o resultado foi 4 ou 7 afeta a distribuição do número de jogadas necessárias 
para que um desses dois números apareça? Muitas pessoas não consideram 
a resposta para essa questão intuitivamente óbvia. Entretanto, suponha que 
invertamos a questão e perguntemos se X é independente de N. Isto é, saber 
quantas jogadas são necessárias para se obter uma soma igual a 4 ou 7 afeta a 
probabilidade de que a soma seja igual a 4? Por exemplo, suponha que saiba- 
mos que são necessárias n jogadas para que se obtenha uma soma igual a 4 ou 
7 Isso afeta a distribuição de probabilidade da soma final? Claramente não, já 
que a única coisa que interessa é que o valor da soma seja 4 ou 7, e o fato de que 
nenhuma das primeiras n — 1 jogadas tenha dado 4 ou 7 não muda as probabili- 
dades da n-ésima jogada. Assim podemos concluir que X é independente de N, 
ou equivalentemente, que N é independente de X. 

Como outro exemplo, seja X,,X,,... uma série de variáveis aleatórias inde- 
pendentes e identicamente distribuídas, e suponha que observemos essas va- 
riáveis aleatórias em sequência. Se X, > X, para cada i = 1,...,n — 1, dizemos 
que X, é um valor recorde. Isto é, cada variável aleatória que é maior que todas 
aquelas que a precedem é chamada de valor recorde. Suponha que 4, represen- 
te o evento em que X, é um valor recorde. É A, ., independente de A,? Isto é, 
saber que a n-ésima variável aleatória é a maior das n primeiras variáveis muda 
a probabilidade de que a (n + 1)-ésima variável seja a maior das primeiras (n 
+ 1) variáveis? Embora seja verdade que A, ,, é independente de 4,, isso pode 
não ser intuitivamente óbvio. Entretanto, se invertermos a questão e pergun- 
tarmos se 4, é independente de 4,,,, então o resultado é mais facilmente en- 
tendido. Pois saber que o (n + 1)-ésimo valor é maior que X,,..., X, claramente 
não nos fornece qualquer informação sobre o tamanho relativo de X, entre as 
primeiras n variáveis aleatórias. De fato, por simetria, fica claro que cada uma 
dessas n variáveis aleatórias tem a mesma probabilidade de ser a maior do con- 
junto, então P(A,IA, 1) = P(A,) = 1/n. Com isso, podemos concluir que 4, e 
A, São eventos independentes. [n 
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Observação: Resulta da identidade 
PX <a,..X <a,) 
=PX=ajPX, <aX <a)..PX,<alX, <= a,.,A1S 44) 


que a independência de X,,..., X, pode ser estabelecida sequencialmente. Isto é, 
podemos mostrar que tais variáveis aleatórias são independentes mostrando que 


X, é independente de X, 
X,é independente de X,, X, 
X, é independente de X,, X,, X, 


X, é independente de X,....,X,. 


6.3 SOMAS DE VARIÁVEIS ALEATÓRIAS INDEPENDENTES 


É muitas vezes importante poder calcular a distribuição de X + Ya partir das 
distribuições de X e Y quando X e Y são independentes. Suponha que X e Y 
sejam variáveis aleatórias independentes contínuas com funções densidade de 
probabilidade f, e f,. A função distribuição cumulativa de X + Y é obtida da 
seguinte maneira: 


Fur)=PX+Y=<a 
= / Fx Cfr) dx dy 


x+y<a 


f. fo. troofronaray (3.1) 


Il 


co pay 
= fel) defe dy 


—00 4 —00 


= [ Fxta — WfrQ) dy 


A função distribuição cumulativa F,, y é chamada de convolução das distribuições 
F,eF, (que são as funções distribuição cumulativa de X e Y, respectivamente). 

Derivando a Equação (3.1), vemos que a função densidade de probabilida- 
de f,.y de X + Y é dada por 


d [6,0] 
fxsv(a) = E) Fyx(a — NfyrQ) dy 


“ d 
= [ aaPxta — yhvo) dy (3.2) 


e fela — NfyrQ) dy 
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6.3.1 Variáveis aleatórias uniformes identicamente distribuídas 


Não é difícil determinar a função densidade da soma de duas variáveis unifor- 
mes independentes no intervalo (0,1). 


Exemplo 3a Soma de duas variáveis aleatórias uniformes 
independentes 


Se Xe Y são variáveis aleatórias independentes, ambas uniformemente distri- 
buídas em (0, 1), calcule a função densidade de probabilidade de X + Y. 


Solução Da Equação (3.2), como 


10<a<1l 
O caso contrário 


fita) = frta) = | 
obtemos 
1 
frsrta = [ feta — yjdy 
Para O = a = 1,isso resulta em 
a 
fxrv(a) = / dy=a 
Paral <a<2,obtemos 
1 
fera = [ dy=2-—-a 
a 


Com isso, 


a 0O<as=l 
fxwy(l)=42-a I<a<2 
0 caso contrário 


Por causa da forma de sua função densidade (veja a Figura 6.3), diz-se que a 


variável aleatória X + Y tem distribuição triangular. E 
fo) 
1 
! x 
0 1 2 


Figura 6.3 Função densidade triangular. 
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Agora, suponha que X,, X,...., X, sejam variáveis aleatórias independentes no 
intervalo (0, 1) e considere 


FlO)-=PX, +..+X =x) 


Embora a fórmula geral para F,(x) seja complicada, ela tem uma forma parti- 
cularmente simples quando x = 1. De fato, usamos agora indução matemática 
para demonstrar que 


Fl)=xWn!i,0<=x<1 
Como a equação anterior é verdadeira para n = 1, suponha que 
Faly= x n=tõ=z*=1 


Agora, escrevendo 
n n-1 
DX=5,X + X 
i=1 i=1 


e usando o fato de que os Xs são todos não negativos, vemos da Equação 3.1 
que, para0<x<1, 


1 
Fut) = [ Frite — Nf, G)dy 


o 1 
“(nn D! 
=x"/n! 


X 
À (x — y)"-l dy pela hipótese de indução 
0 


o que completa a demonstração. 

Para uma aplicação interessante da fórmula anterior, vamos usá-la para de- 
terminar o número esperado de variáveis aleatórias uniformes independentes 
no intervalo (0, 1) que precisam ser somadas para que o resultado seja maior 
que 1. Isto é, com X,, X,,... sendo variáveis aleatórias uniformes independentes 
no intervalo (0, 1), queremos determinar E[N], onde 


N=minfn:X +... + X,>1] 


Notando que N é maior que n > 0 se e somente se X, +... + X, = 1, vemos 
que 


PN>n)=F(D)=1n!,n>0 
Como 
PIN>0)=1=1/0! 


vemos que, para n > 0, 
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Portanto, 


Isto é, o número de variáveis aleatórias uniformes independentes no intervalo (0, 
1) que precisam ser somadas para que o resultado seja maior que 1 é igual a e. 


6.3.2 Variáveis aleatórias gama 
Lembre-se da variável aleatória gama, que tem função densidade da forma 


ea 
O a ER 


0O<y<o 


Uma importante propriedade desta família de distribuições é a de que, para um 
valor fixo de À, ela é fechada em convoluções. 


Proposição 3.1 Se Xe Ysão variáveis aleatórias gama independentes com 
respectivos parâmetros (s,A) e (1,A), então X + Y é uma variável aleatória 
gama com parâmetros (s + t,A). 


Demonstração Usando a Equação (3.2), obtemos 
1 a 
E sie À —A(a—y) À a» s—1 —Ay À Ig 
feerta) = o |, ANE IMa — ae! dy 
a 
= Kodo [ (a e yoly-idy 


1 
= Ca q À d — wly-ldx fazendo x = - 
0 


= Ce Mi gstt-1 


onde C é uma constante que não depende de a. Mas, como a fórmula an- 
terior é uma função densidade, e portanto sua integral deve ser igual a 1, 
pode-se determinar o valor de C. Com isso, temos 


AAA (Aa) tt 


fxsvla) = P(6s + O 


e o resultado está demonstrado. Im 


É fácil agora estabelecer, por indução e usando a Proposição 3.1, que, se X,, 
i=1,..,n são variáveis aleatórias gama com respectivos parâmetros (t,A),i = 


n n 
1....,n, então >, X; é gama com parâmetros t;,A |. Deixamos a demonstra- 
FA 2 > 18) 
i=1 i=1 
ção disso como exercício. 


Capítulo 6 * Variáveis Aleatórias Conjuntamente Distribuídas 309 


Exemplo 3b . 

Suponha que X,, X,...., X, sejam n variáveis aleatórias exponenciais indepen- 
dentes, cada uma com parâmetro À. Então, como uma variável aleatória expo- 
nencial com parâmetro À é igual a uma variável aleatória gama com parâmetros 
(1,A), resulta da Proposição 3.1 que X, + X, + --- + X, é uma variável aleatória 
gama com parâmetros (n,A). E 


Se Z,, Z,...., Z, São variáveis aleatórias normais padrão independentes, en- 
n 
tão >) Ze é chamada de distribuição qui-quadrado (às vezes representada como 
i=1 
x) com n graus de liberdade. Vamos calcular a função densidade de Y. Quando 
n=1,Y= Z e do Exemplo 7b do Capítulo 5 vemos que sua função densidade 
de probabilidade é dada por 


1 
pad + fa 
20) = FED + 26] 
— AZ 
2/7 2x 
le (y/9)/2-1 


NAid 
Mas ra a equação anterior como sendo à distribuição gama 


com parâmetros ( 5, 5 ) [um subproduto dessa análise é que NE = 7]. Mas 
p 2 > Pp 


como cada Ze é gama (4, 5) resulta da Proposição 3.1 que a SE X 
com n graus de liberdade é tão somente a distribuição gama com parâmetros 


(n/2, 5) Ela portanto tem a função densidade de probabilidade dada por 


n/2-1 
Ê E y>0 


"() 


—y/29n/2—1 
= sda y>0 


n 
pn2r (É 
(3) 


Quando n é um inteiro par, T(n/2) = [(n/2) — 1]!. Por outro lado, quando n é 
ímpar, T(n/2) pode ser obtido fazendo-se iterações com T'(t) = (t- D)I(t- 1) e 


feO) = 


então empregando-se o resultado previamente obtido de que T' 5 = 7 [por 
exemplo, F (3) = 30(3)= 5351 (3 )- 347]. 

Na prática, a distribuição qui-quadrado aparece com frequência como a 
distribuição do quadrado do erro envolvido quando se tenta acertar um alvo 
em um espaço n-dimensional se os erros das coordenadas são representados 
como variáveis aleatórias normais padrão. Ela também é importante em análi- 
ses estatísticas. 
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6.3.3 Variáveis aleatórias normais 


Também podemos usar a Equação (3.2) para demonstrar o seguinte resultado 
importante sobre as variáveis aleatórias normais. 
Proposição 3.2 Se X,i=h1.,...,n,são o aleatórias normalmente distri- 
buídas com respectivos paRInSTOS HpoZ,i = ,...,n, então > X; é normalmen- 
i=1 

te distribuída com parâmetros ss Hie Ê o? 

i=1 i=1 
Demonstração da Proposição 3.2 Para começar, suponha que X e Y sejam 
variáveis aleatórias normais independentes com X tendo média O e variância 
&”,e Y tendo média O e variância 1. Vamos determinar a função densidade de X 
+ Y utilizando a Equação (3.2). Agora, com 


tl lho? 
“202 2º 29? 


temos 
1 (a-yY| 1 y 
a — =" epi) —>— |-=epi-> 
= Rede [de ex 2 2 a 
mo CEA gp PAS Vi +40? 
Portanto, da Equação (3.2), 
— a? a? 
Jxr(a) = 5. Eep|- 2 DO PE] 
(9,0) a 2 
x — ————s d 
E: ven e (> 1 + a) | é 
1 a [0,0] 3 
= saem |- Zi Fo mês) E exp(—-cx") dx 


a2 
= C exp fi 2d + 02) 


onde C não depende de a. Mas isso implica que X + Y é normal com média O 
e variância 1 + o”. 

Agora, suponha que X, e X, sejam variáveis aleatórias normais indepen- 
dentes X, com média q, e variância o 2, i = 1,2. Então, 


X — X — 
a o A 
2 52 


x + %2=00( )rmtm 
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Mas como (X, — u;)/o, é normal com média O e variância oi/o2, e (X, — 
Ho)/o, é normal com média O e variância 1, segue de nosso resultado pré- 
vio que (X, — uj)/0, + (X, — mo)/o, é normal com média O e variância 1 
+ o?/o2. Isso implica X, + X, ser normal com média u, + x, e variância 
oZ(1 + 02/02) = El + o2. 

Assim, estabelece-se a Proposição 3.2 quando n = 2. O caso geral é agora 
obtido por indução. Suponha que a Proposição 3.2 seja verdadeira quando há 
n-—1 variáveis aleatórias. Agora considere o caso n e escreva 


n n-1 
a X;= 3x + Xa 
i=1 i=1 
n—1 n—-1 n-1 
Pela hipótese de indução, 5' X; é normal com média 5º w;e variância 5º o2. 
i=1 a i=1 ão ni 
Portanto, pelo resultado para n = 2, 5) X; é normal com média 3" u;e va- 
i=1 i=1 


n 
riância 3) o2. 
i=1 
Exemplo 3c 


Um time de basquete jogará uma temporada com 44 partidas. Vinte e seis des- 
sas partidas serão contra times da divisão A, e 18 contra times da divisão B. 
Suponha que o time ganhe cada partida disputada contra um adversário da 
divisão A com probabilidade 0,4, e ganhe cada partida disputada contra um 
adversário da divisão B com probabilidade 0,7 Suponha também que os resul- 
tados das diferentes partidas sejam independentes. Obtenha um valor aproxi- 
mado para a probabilidade de que 


(a) o time vença 25 partidas ou mais; 
(b) o time vença mais partidas contra times da divisão A do que contra times 
da divisão B. 


Solução (a) Suponha que X, e X, representem, respectivamente, o número de 
partidas que o time vence contra equipes da divisão A e B. Note que X, e X, são 
variáveis aleatórias binomiais independentes e 


EIX,] = 26(0,4) = 10,4 Var(X,) = 26(0,4)(0,6) = 6,24 
ELX,) = 18(0,7) = 12,6 Var(X,) = 18(0,7)(0,3) = 3,78 


Pela aproximação normal para a distribuição binomial, X, e X, têm aproxi- 
madamente a mesma distribuição que teriam variáveis aleatórias normais in- 
dependentes com os valores esperados e as variâncias acima. Portanto, pela 
Proposição 3.2, X, + X, terá aproximadamente uma distribuição normal com 
média 23 e variância 10,02. Assim, fazendo com que Z represente uma variável 
aleatória normal padrão, temos 
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P(XA + Xp =25)=P(X4 + Xp = 245) 
= a | 


10,02 — 10,02 


1,5 
x PliZ= , 
| Ao | 
=x 1-— P(Z < 0,4739) 
= 0,3178 


b) Notamos que X, - X, tem aproximadamente uma distribuição normal com 
q A B p Ç 
média -2,2 e variância 10,02. Com isso, 


P(X, — Xp = D)=P(X4 — Xp = 0,5) 
-pjX- XB +22. 05 +22 
10,02 — “10,02 


2:7 
a PiZ> ? 
| Ao | 
=1-— P(Z < 0,8530) 
= 0,1968 


Portanto, há aproximadamente 31,78% de chances de que o time ganhe pelo 
menos 25 partidas, e aproximadamente 19,68% de chances de que o time ganhe 
mais partidas contra times da divisão A do que contra times da divisão B. 


A variável aleatória Y é chamada de log-normal com parâmetros qu e o se 

4 E 2. 2a: EN : 2 4 4 

log(Y) é uma variável aleatória normal com média q e variância o”. Isto é, Y é 
log-normal se puder ser escrita como 


Y=e 


onde X é uma variável aleatória normal. 


Exemplo 3d 


Começando de certo instante fixo, suponha que S(n) represente o preço de 
um depósito ao final de n semanas, n = 1. Um modelo popular para a evolução 
desses preços supõe que as relações entre os preços S(n)/S(n — 1),n = 1, sejam 
variáveis aleatórias log-normais independentes e identicamente distribuídas. 
Considerando esse modelo com parâmetros u = 0,0165, o = 0,0730, qual é a 
probabilidade de que 


(a) o preço do depósito suba ao longo de cada uma das próximas duas se- 
manas? 


(b) o preço no final de duas semanas seja maior do que é hoje? 
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Solução Seja Z uma variável aleatória normal padrão. Para resolver a letra 
(a), usamos o fato de que log(x) aumenta em x para concluir que x > 1 se e 
somente se log(x) > log(1) = 0. Como resultado, temos 


s(1) x s(1) 
Pis) E Jr [oe(50) é ] 


—0,0165 
=P > 
|z 7? "00730 | 
= P(Z < 0,2260) 
= 0,5894 


Em outras palavras, a probabilidade de que o preço suba após 1 semana é de 
0,5894. Como as relações de preço sucessivas são independentes, a probabilida- 
de de que o preço suba ao longo de cada uma das próximas duas semanas é de 
(0,5894)” = 0,3474. 

Para resolver a letra (b), raciocinamos da seguinte maneira: 


S(2) S(Q) S(1) 
2 (50) É = 2 (ses) ú 1| 


5 sQ) s() 
E ef cs (st) " os (50) É ] 


Entretanto, log(32) + log( st) sendo a soma de duas variáveis aleatórias 


normais independentes, ambas com média 0,0165 e desvio padrão 0,0730, 
é uma variável aleatória normal com média 0,0330 e variância 2(0,0730)”. 
Consequentemente, 


S2) | —0,0330 
Pi >1l,=PiZ> -————= 
| S(0) | 0,07302 | 
=P(Z < 0,31965) 
= 0,6254 = 


6.3.4 Variáveis aleatórias binomiais e de Poisson 


Em vez de tentarmos deduzir uma expressão geral para a distribuição de X + 
Y no caso discreto, vamos considerar alguns exemplos. 


Exemplo 3e Somas de variáveis aleatórias de Poisson independentes 


Se Xe Y são variáveis aleatórias de Poisson independentes com respectivos 
parâmetros A, e À,, calcule a distribuição de X + Y. 
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Solução Como o evento [X + Y = n] pode ser escrito como a união dos even- 
tos disjuntos [X = k,Y=n-k|,0=<k <= n,temos 


PX+Y=)=5 PlX=kY=n-&k 
k=0 


=5 PX=KHPW=n-—k) 
k=0 


n k —k 
= De! SR A 
! Es ! 
Pd k! (n — k)! 


n kyn—k 
= et) B AA, 
feia — 1)! 


—(AL+HA n 
e (Ar+HAz) n! kqn-k 
2 


À 
] Han = Jordi 
n! = kn — k)! 


e Mit) 
(A + 29)! 
n! 


Assim, X, + X, tem uma distribuição de Poisson com parâmetros A, + À,. E 


Exemplo 3f  Somas de variáveis aleatórias binomiais independentes 


Sejam Xe Y variáveis aleatórias binomiais independentes com respectivos pa- 
râmetros (n, p) e (m, p). Calcule a distribuição de X + Y. 


Solução Relembrando a interpretação de uma variável aleatória binomial, 
e sem qualquer cálculo, podemos imediatamente concluir que X + Y é bino- 
mial com parâmetros (n + m, p). Isso ocorre porque X representa o número 
de sucessos em n tentativas independentes, cada uma das quais com probabi- 
lidade de sucesso p; similarmente, Y representa o número de sucessos em m 
tentativas independentes, cada uma das quais com probabilidade de sucesso 
p. Com isso, dada a independência de X e Y, tem-se que X + Y represen- 
ta o número de sucessos em n + m tentativas independentes quando cada 
tentativa tem probabilidade de sucesso p. Entretanto, X + Y é uma variável 
aleatória binomial com parâmetros (n + m, p). Para verificar essa conclusão 
analiticamente, note que 


n 
PX+Y=0=5 PlX=iY=k-i 
i=0 


= De dps JPY =k —i) 
i=0 


n 
pe hn Pi n-i m k-i m—k+i 
=D (5 )ria (ara 

il 
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ondeg=1-pe onde (7 ) = (O) quando j < 0. Assim, 
n 
o o kontm-k n m 
PX+Y=W=ptg D()(42) 
= 


e a conclusão resulta da aplicação da identidade combinatória 
n 
n+tm o. n m 
(E) LO) 
i=0 n 


6.3.5 Variáveis aleatórias geométricas 

Sejam X,,..., X, variáveis aleatórias geométricas independentes, com X, tendo 
parâmetro p, para i = 1,...,n. Estamos interessados em calcular a função dis- 
creta de probabilidade da soma $, = É ey X;. Para uma aplicação, considere 
n moedas, cada uma com probabilidade p, de dar cara, i = 1,...,n. Suponha que 
a moeda 1 seja jogada até que dê cara, instante a partir do qual a moeda 2 co- 
meça a ser jogada até que dê cara, e então a moeda 3 é jogada até que dê cara, 
e assim por diante. Se X, representa o número de jogadas feitas com a moeda 
i então X,, X,,..., X, são variáveis aleatórias geométricas com respectivos pa- 
râmetros p,, Dy....P» € Sn = > ;-1 X; representa o número total de jogadas. Se 
todos os p, são iguais — digamos, p, = p—- então S, tem a mesma distribuição que 
o número de jogadas necessárias para que se obtenha um total de n caras com 
uma moeda com probabilidade p de dar cara, e então $, é uma variável aleató- 
ria binomial negativa com função discreta de probabilidade 


PlSa=k)= (: q Dera — pr k=n 


Como um prelúdio para a determinação da função discreta de probabilidade 
de S, quando todos os p; são distintos, vamos primeiro considerar o caso n = 2. 
Fazendo q, = 1 -p,j = 1,2, obtemos 

k—-1 

PS2=0)=) PM =jM=k-j 
j=1 
k-1 
=> Pl =P, =k — j) (pela independência) 
j=1 


= —1 k-j-1 
= Pig, Poda 
1 


k—1 
= ppa) * 3 (arg! 
j=1 
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21 - (gg)! 
1-— q1/q2 
puras! papa! 


q —an q—oan 
k1 Pp ko P2 
=D2qg) ——— + p1q 
Ê bi — P2 E p2 — p1 


= pipogé 


Se agora fizermos n = 3 e calcularmos P(S, = k) começando com a identidade 


k—-1 k—-l1 
PS=k=> PlSo=,X=k-)J=)5 AS=PMo=k-)) 
j=1 j=1 


e então substituindo a fórmula deduzida para a função de probabilidade de 5,, 


obtemos, após algumas manipulações, 
2 3 1 3 
PIS =k=pgt! 2 Bi 4 pgto 
Pp2 — P1P3 — P1 Pi — P2P3 — P2 
E > 


+ p3q 
» pi — P3P2 — D3 


As funções de probabilidade de S, e $, levam à seguinte conjectura para a fun- 
ção de probabilidade de S,. 


Proposição 3.3 Suponha que X,...., X, sejam variáveis aleatórias geométricas 
independentes, com X, tendo parâmetro p, para i = 1,...,n. Se todos os p;s são 
distintos, então, para k = n, 


= Prato j o; 


[e E 


Demonstração da Proposição 3.3 Vamos demonstrar essa proposição por in- 
dução no valor de n + k. Como a proposição é verdadeira quando n = 2,k = 2, 
suponha, como hipótese de indução, que isso seja verdade para qualquer k = 
n no qualn + k = r. Agora, suponha que k = n seja talquen + k = r + 1. Para 
calcular P(S, = kJ], condicionamos na ocorrência de X, = 1. Isso resulta em 

PS=k=PMS,=kX=D)PMAM,= + PS, =KX, > DPX, > 1) 

= PS, = k|X, = 1)pn + PS, = klXn > Dgn 

Agora, 

P(Sa = KAXn=1)=PMS,1=k — UX =1) 

=P(S, 1=k — 1) (pela independência) 


n-1 . 
= õ. pg? HH ii. (pela hipótese de indução) 
- ich Pj — Pi 


Agora, se X é uma variável aleatória geométrica com parâmetro p, então a dis- 
tribuição condicional de X dado que ele é maior que 1 é igual à distribuição de 
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1 (a primeira tentativa malsucedida) mais uma variável geométrica com pará- 
metro p (o número de tentativas adicionais após a primeira até que um sucesso 
ocorra). Consequentemente, 


PSn=kX>)=PM+.. + +X +1=k) 


mé a =k-— 1) 
k—2 

= Dei ll=s 
de p 


onde a última igualdade resulta da hipótese de indução. Assim, do desenvolvi- 
mento anterior, obtemos 


n—1 
PSa=M=p) pai” TI 


+ Qn DU gi [H —— 


i=1 ixjen— E = » isjen Pi O p É 
n-1 
=p pia? |] —— + qn Sou O À Ee 
i=1 ig 1 E p ixjsn E p 
+ GnPngh” É es ; 
Em o 
ndo 
n-1 
k-2 
= 2 pit dd [o —— + pat] —— 
i=l - Pi izjsn— DE 2 e » 
Agora, usando 
EE qn crio PT GM qi 
Pn — Pi Pn — Pi Pn — Pi 
obtemos 
P(Sn = k) = Soa bis pe TI 
jan P j<n P; Pn 
n 
Es Pp 
SUA 
i=t jái Pjo Pi 
e a demonstração por indução está completa. E 


6.4 DISTRIBUIÇÕES CONDICIONAIS: CASO DISCRETO 
Lembre que, para dois eventos E e F, a probabilidade condicional de E dado F 
é definida, com P(F) > 0, por 
P(EF) 


P(EIP = Bl 
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Com isso, se X e Y são variáveis aleatórias discretas, é natural definir a função 
discreta de probabilidade de X dado que Y = y como 


pxivG|) = PX =x]Y = 9) 
PMX=xY=)) 
= PY =>) 

— PQ,y) 
PyQ) 


para todos os valores de y tais que py(y) > 0. Similarmente, a função distribui- 
ção de probabilidade condicional de X dado que Y = y é definida, para todo y 
tal que p(y) > 0, como 


Fxytly) =PX <= x|Y =) 
= > pxirtaly) 


asx 


Em outras palavras, as definições são exatamente iguais ao caso incondicional, 
exceto que tudo é agora condicionado no evento em que Y = y. Se X é inde- 
pendente de Y, então a função de probabilidade condicional e a função distri- 
buição são iguais aos respectivos casos incondicionais. Isso resulta porque, se X 
é independente de Y, então 


PxiyOdy) = PAX =x]Y = y) 
P(X =x,Y=)y) 
PX=PY=y) 
E PY =)) 
=P(X =>) 


Exemplo 4a 


Suponha que p(x,y), a função discreta de probabilidade conjunta de X e Y, seja 
dada por 


p(0,0) = 0,4 p(0,1)=0,2  p(1,0)=01 p(1,1) = 0,3 
Calcule a função de probabilidade condicional de X dado que Y = 1. 
Solução Primeiros notamos que 


pyrD=5 peD=pO,+pLD=0S 


Assim, 
POD 2 


py(lb) 5 


pxy(OI1) = 
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PLD 3 


py(D 5 E 


px|y (HT) = 


Exemplo 4b 


Se Xe Y são variáveis aleatórias de Poisson independentes com respectivos pa- 
râmetros À, e À,, calcule a distribuição condicional de X dado que X + Y =. 


Solução Calculamos a função de probabilidade condicional de X dado que X 
+ Y = n da seguinte maneira: 


PX=kX+Y- 
psi ee est 


PX + Y=n) 
PiX=kYen=l 
CO PX+Y=n) 
“PX=WPY=n-k 
PX + Y=n) 


onde a última igualdade resulta da hipótese de independência de X e Y. Lem- 
brando (Exemplo 3e) que X + Y tem uma distribuição de Poisson com parã- 
metro À, + A,, vemos que a equação anterior é igual a 


- 
ek e dpDt Det (A + Ao) 
k (nd! nt 
Lo RASA 

(n = UK (A + A)? 


(0) (15) (15) 
Aka + A + À2 


Em outras palavras, a distribuição condicional de X dado que X + Y = n é bi- 
nomial com parâmetros n e A;(A, + À,). = 


PX=HX+Y=n= 


Podemos também falar de distribuições condicionais conjuntas, conforme 
indicado nos próximos dois exemplos. 


Exemplo 4c 
Considere a distribuição multinomial com função de probabilidade conjunta 


n! 
P(X=n,i=1),...k)= nn lo n;zo0, * p= 


Obtém-se tal função de probabilidade quando n tentativas independentes são 
FeatizAdas com cada tentativa levando ao resultado i com probabilidade p,, 
pi = 1.Asvariáveis aleatórias X, i = 1,...,k, representam, respectivamente, 
o número de tentativas que levam ao resultado i, i = 1,...,k. Suponha que saiba- 
mos que n, das tentativas tenham levado ao resultado ;, para j = r + 1,...,k, onde 
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3 114; =m = n. Então, como cada uma das demais n — m tentativas deve ter 
levado a um dos resultados 1,..., r, parece-nos que a distribuição condicional de 
XX, é multinomial em n — m tentativas com respectivas probabilidades 
Pi. 
=" i=1.r 
F, 
onde F, = 5:14 p; é a probabilidade de que uma tentativa leve a um dos resul- 
tados 1,...,r. 


Pt(resultado ilresultado não é nenhum de r + 1,...,k) 


Solução Para verificar essa intuição, faça com que n,,..., n, sejam tais que 
Sisni=n — m. Então, 
PM =m,..X =nX o =hn,.. Xe =nk) 
O PMM=m,.Xk=m 
PX,m = Hy4t-  Xk =— nã) 


n! m Hr i++ nk 
ml-aP1 Pr Pa Pk 


n! nm Rr mlk 
Gina ça enal Fr Pa Pk 


onde a probabilidade no denominador foi obtida considerando-se os resultados 

1,...,r como um único resultado com probabilidade F,. Isso mostra que a probabili- 

dade é multinomial em n tentativas com probabilidades de resultados F, p,,.-,Py 

Como5': 4n;=n — m, pode-se escrever o resultado anterior como 
PM = hn... 5X, = nIX =ha41-- Xk = nid 

GM —m! Plym...(Pr 

m!-n E, F, 


pr 
e nossa intuição é confirmada. " 


Exemplo 4d 


Considere n tentativas independentes, com cada tentativa sendo um sucesso 
com probabilidade p. Dado um total de k sucessos, mostre que todas as possí- 
veis ordenações dos k sucessos e n — k fracassos são igualmente prováveis. 


Solução Queremos mostrar que, dado um total de k sucessos, cada uma das 
(1) ordenações possíveis de k sucessos e n — k fracassos é igualmente provável. 
Suponha que X represente o número de sucessos, e considere qualquer ordena- 
ção de k sucessos e n — k fracassos, digamos, 0 = (8,5, f;f;...,1). Então, 


P(olX = kh) = = 
P(o) 
“ PX=h 
o pé — py 
“pia — py 
1 


() n 
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6.5 DISTRIBUIÇÕES CONDICIONAIS: CASO CONTÍNUO 


Se X e Y têm função densidade de probabilidade conjunta f(x, y), então a fun- 
ção densidade de probabilidade condicional de X dado que Y = y é definida, 
para todos os valores de y tais que f(y) > 0, como 

fG,)) 

fr0) 


Para motivar essa definição, multiplique o lado esquerdo por dx e o lado direito 
por (dx dy)/dy para obter 


fxiy GI) = 


fix, y) dxdy 


fr0) dy 
.Pusisrxr+d,y=sYsy+ dy) 


PysY=<sy+ dy) 
=Px=Xsx+dly<Y=<y+ dy) 


fxry Gely) dx = 


Em outras palavras, para valores pequenos de dx e dy, fy(xl|y)dx representa a 
probabilidade condicional de que X esteja entre x e x + dx dado que Y esteja 
entreyey + dy. 

O uso de densidades condicionais nos permite definir probabilidades con- 
dicionais de eventos associados a uma variável aleatória quando conhecemos 
o valor de uma segunda variável aleatória. Isto é, se X e Y são conjuntamente 
contínuas, então, para qualquer conjunto 4, 


P(XeAY=y)= [faire as 


Em particular, fazendo 4 = (-0, a], podemos definir a função distribuição 
cumulativa condicional de X dado que Y = y como 


a 
Fxyr(aly) = PX =salY=y)= | fxyrtly) dx 
—00 
O leitor deve notar que, ao usarmos as idéias apresentadas na discussão ante- 
rior, obtivemos expressões para probabilidades condicionais com as quais po- 
demos trabalhar, muito embora o evento no qual estejamos colocando a condi- 
ção (isto é,o evento [Y = y)) tenha probabilidade 0. 


Exemplo 5a 
A função densidade conjunta de X e Y é dada por 


fine O Rs 0O<x<1l,0<y<l 


0 caso contrário 


Calcule a densidade condicional de X dado que Y = y,onde0<y <1. 
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Solução: Para0<x<1,0<y<1,temos 


F(x,)) 

fr0) 

o fw) 
Co tujldr 
x2 — x — 3) 


fxivGIy) = 


“fix2-x-ydr 
AQ —x—)) 
5 — y/2 
RD = de DO) 
= 4-—-3y = 


Exemplo 5b 
Suponha que a densidade conjunta de X e Y seja dada por 
ee) 
fen=1 9» 
0 caso contrário 


0O<x<o,0<y<coco 


Determine P(X > 1|Y = y) 


Solução Primeiro obtemos a densidade condicional de X dado que Y = y. 


f(x,y) 

fr0) 

E e De /y 
“e Alpes dx 


des i ey 
y 


xy Gy) = 


Portanto, 


e 
P(X > 1Y=)) =| e dx 
1) 
e: —ecaio(o 
1 
=e m 


Se Xe Ysão variáveis aleatórias independentes contínuas, a densidade con- 
dicional de X dado que Y = y é somente a densidade incondicional de X. Isso 
ocorre porque, no caso independente, 

foy)  fxo)fr0) 


fxir GI) = BO EO) = fx(x) 
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Também podemos falar de distribuições condicionais quando as variáveis alea- 
tórias não são nem conjuntamente contínuas, nem conjuntamente discretas. Por 
exemplo, suponha que X seja uma variável aleatória contínua com função den- 
sidade de probabilidade f, e que N uma variável aleatória discreta, e considere 
a distribuição condicional de X dado que N = n. Então, 


Px <X<x+ daiN=n) 


dx 
—PN=nx<X<x+dyPa<hX<ax+ dx) 
= P(N =n) dx 


e fazendo dx tender a 0, obtemos 
lim Px <X<x+d|N=n) PN=n|X=+>) 
dx>0 dx “  PfN=n) 


fQ) 


o que mostra que a densidade condicional de X dado que N = n é dada por 
 PN=nX=>) 
tc =ow=a O 


Exemplo 5c A distribuição normal bivariada 


Uma das mais importantes distribuições conjuntas é a distribuição normal bi- 
variada. Dizemos que as variáveis aleatórias X e Y têm distribuição normal 
bivariada se, para as constantes w,, 4,0, > 0,0,>0,-1<p<1,sua função 
densidade conjunta é dada, para todo —o < x,y < oo, por 


1 1 x — e 
L)=———w[ww— exp |-———— 
a 2m0xoyv1l — p? ' 21 — 0?) ( Ox 


2 
+(º - e) op ED UDO — ty) 


0y 0x0y 


Determinamos agora a densidade condicional de X dado que Y = y. Ao fa- 
zer isso, vamos coletar continuamente todos os fatores que não dependem de 
x e representá-los pelas constantes C;. A constante final é então determinada 
usando-se /fxiy(x|y) dx = 1. Temos 
fQ,)) 
Exyy Gl) FrO) 
= Cf(x,y) 


1 XxX — dx E xy — uy) 
= 
"CP 2a — 93 ( o de= 
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1 


2 Ox 
at DD ——————— — 2x —— u— 
C3 exp 24 = 03) x ( + fd 09) 


1 Fo; 
= Cy exp “EDS O jur= (na ES ço Ee 19) 


Reconhecendo a equação anterior como uma função de densidade normal, po- 
demos concluir que, dado que Y = »,a variável aleatória X é normalmente 
distribuída com média uy + p 50 — |y) e variância oZ(1 — 9º). Além disso, 


como a densidade conjunta de y, X é exatamente igual à de X, Y, exceto que qu, 
o, são trocadas por Hp o, tem-se similarmente que a distribuição condicional 
de Y dado que X = x é uma distribuição normal com média uy + E E (x — Ux) 
e variância o — p?). Como consequência desses resultados, tem-se que a 
condição necessária e suficiente para que as variáveis aleatórias normais bi- 
variadas X e Y sejam independentes é que p = O (um resultado que também é 
consequência direta de sua densidade conjunta, porque somente quando p = O 
a função densidade pode ser fatorada em dois termos, um dependendo apenas 
de x e o outro dependendo apenas de y). 
ComC= -— 1. a densidade marginal de X pode ser obtida de 


2m0x0ys/ 1-9? 
ADE / fx) dy 


0x0y 


ap E UDO = 2) 


? É» obtemos 
9y 


= 1 X— dx : 
foco = Covenp | — a( ox ) ) 
* Leela [é = tee ar 
1 a 1 X — Mx E E 42 
- Cope | 5 El E ) a o) 


00 1 x— Ux 2 
x ED e es 
Fe] 21 — 9?) |” Pa | | E 


Fazendo a mudança de variáveis w = 
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Como 


E : L E dw=1 
nl Pb arm es 


vemos que 
2 2 
fx0) = Coy/27(1 — p2) e Pta Mas 
dado ARE OE 
V2H0x 
Isto é, X é normal com média |, e variância oz Similarmente, Y é normal com 
média 4, e variância o7. E 
Exemplo 5d 


Considere n + m tentativas com mesma probabilidade de sucesso. Suponha, no 
entanto, que essa probabilidade de sucesso não seja fixada antecipadamente, 
mas escolhida de uma população uniforme no intervalo (0, 1). Qual é a distri- 
buição condicional das probabilidades de sucesso dado que as n + m tentativas 
resultam em n sucessos? 


Solução Se X representa a probabilidade de que uma dada tentativa seja um 
sucesso, então X é uma variável aleatória uniforme no intervalo (0,1). Também, 
dado que X = x,asn + m tentativas são independentes com probabilidade de 
sucesso x. Com isso, N, o número de sucessos, é uma variável binomial com pa- 
râmetros (n + m,x), e a densidade condicional de X dado que N = n é 
PIN =nIX = x)fx(9 
PIN =n) 
Ee nd — pm 


n 
PN=n) 
=cx"(1 — 9)” 


fxn(aln) = 


0O<x<1l 


onde c não depende de x. Assim, a densidade condicional é igual à de uma va- 
riável aleatória beta com parâmetros n + 1,m + 1. 

O resultado anterior é bastante interessante, pois ele diz que, se a distribui- 
ção original ou a priori (para aquele conjunto de dados) de uma probabilidade 
de sucesso em uma tentativa é uniformemente distribuída no intervalo (0, 1) 
[ou, equivalentemente, é beta com parâmetros (1,1)], então a distribuição poste- 
rior (ou condicional) dado que um total de n sucessos tenha ocorrido em n + m 
tentativas é beta com parâmetros (1 + n,1 + m). Isto é valioso porque aumenta 
a nossa intuição sobre o que significa supor que uma variável aleatória tenha 
uma distribuição beta. n 
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*6.6 ESTATÍSTICAS DE ORDEM 
Suponha que X,, X,,..., X, sejam n variáveis aleatórias contínuas e identicamen- 
te distribuídas com mesmas função densidade fe função distribuição F. Defina 
X«)y = menor de X, Xo, ..., Xy 
X2) = segunda menor de X4, Xo, ..., Xyn 


Xp = j-ésima menor de X, X2,..., Xu 


Xm) = maior de Xi, Xo, PR Xn 


Os valores ordenados X,, = X, <... = X,, são conhecidos como as estatísticas 
de ordem correspondentes às variáveis aleatórias X,, X,,... X,. Em outras pala- 
vras, X1;--.» X(m) SãO Os valores ordenados de X,,..., X,. 

A função densidade conjunta das estatísticas de ordem é obtida notando-se 
que as estatísticas de ordem X,,..., X x) assumirão os valores x, <x, <... <x, Se, 
e somente se, para alguma permutação (i,, i,,..., i,) de (1,2,...,n), 


X1 =X, Ã92 = Xiz,- se »Xn = Xig 


Como, para qualquer permutação (i,,..., i,) de (1,2,...,n), 
£ 


E 
39º" 00%i Es 2 < Ka < Ai, + | 
sa e" fr 5 An (Xi, eco Xi) 


= ef) fi) 
=e"f(xy)---f(Xn) 


tem-se que, parax, <x, <..<X,, 


E E 
Plm-5<M <AXy+s 


[a 
9.0.3, 


€ € 
) m= 5 <Xo <% +5) 


Pla <Aao<n+ 2 


2 
= nte"f()---flxn) 


Dividindo por «” e fazendo e—=0, obtemos 
ExayXmy CX ce con) = FO) --fOn) 1 < 12 << (61) 


A Equação (6.1) é mais simplesmente explicada mostrando-se que, para que o 
vetor (X (13... X(n)) Seja igual a (X,3..., X,), é necessário e suficiente que (X,,..., X,) 
seja igual a uma das n! permutações de (x,,..., x,). Como a probabilidade (den- 
sidade) de que (X,,..., X,) seja igual a qualquer dada permutação de (x,,...,x,) é 
somente f(x,)... f(x,), obtém-se como resultado a Equação (6.1). 
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Exemplo 6a 


Ao longo de uma estrada com 1 km de comprimento estão 3 pessoas “distribuí- 
das aleatoriamente” Determine a probabilidade de que 2 pessoas não estejam a 
uma distância d entre si quando d <= à km. 


Solução Vamos supor que “distribuídas aleatoriamente” signifique que as 
posições das 3 pessoas sejam independente e uniformemente distribuídas ao 
longo da estrada. Se X, representa a posição da i-ésima pessoa, então a proba- 
bilidade desejada é P(X,, > Xu + d,i = 2,3]. Como 


ExayXo Xe (12,3) =31 0<xm<x <x<1 
tem-se que 


PlXo > Xi + di=2,3])= ai Exa XX) (1,X2,X3) dy dxo dx3 
Xi>xj-+d 


i-2d pt-d pl 
=3! / [ [ dx3 dxo dx1 
0 xi+d Jxo+d 


1-2d pl-d 
=6 [ / 1 -— d — x) dx dx 
0 x+d 


1-24 pl-2d-x 
=6 À À y2 dyz dx1 
0 0 


onde fizemos a mudança de variáveis y, = 1 — d — x,. Continuando a cadeia de 
igualdades, obtemos 


1-2d 
sa (1 -—- 2d — xy)? dx 
0 


1-2d 2 
= SS) X» dy 
0 
=(1-242 


Com isso, a probabilidade desejada de que 2 pessoas não estejam a uma distân- 
cia d entre si quando 3 pessoas estão uniforme e independentemente distribuí- 
das ao longo de um intervalo de tamanho 1 é igual a (1 — 2d) quando d = > De 
fato, o mesmo método pode ser usado para provar que quando n pessoas estão 
distribuídas aleatoriamente ao longo de um intervalo unitário, a probabilidade 
desejada é 


1 
[1 - (n— 1)d]" quando d = RE 
A demonstração é deixada como exercício. E 


A função densidade da estatística de j-ésima ordem X,, pode ser obtida 
integrando-se a função densidade de probabilidade (6.1) ou empregando-se 
o seguinte raciocínio: para que X,, seja igual a x, é necessário que j - 1 dos n 
valores X,,..., X, sejam menores que x,n —j deles maiores que x, e 1 deles igual 
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a x. Agora, a densidade de probabilidade de que qualquer conjunto de j — 1 ele- 
mentos dos X;s seja menor que x, de que outro conjunto de n — j elementos seja 
maior que x, e de que o valor restante seja igual a x é dada por 


LEG) E = FO) RO) 


Com isso, como existem 


n = n! 
Je linr=As m=iG= a 
partições diferentes das n variáveis aleatórias X,...., X, nos três grupos prece- 
dentes, tem-se que a função densidade de X,, é dada por 


Ixo 0) = [EGP — Fe)Jifo) (6.2) 


n! 
DG = IN 


Exemplo 6b 


Quando se observa uma amostra de 2n + 1 variáveis aleatórias (isto é,2n + 1 
variáveis aleatórias independente e identicamente distribuídas), o (n + 1)-ési- 
mo menor valor é chamado de mediana amostral. Se uma amostra de tamanho 
3 é observada em uma distribuição uniforme ao longo do intervalo (0,1), deter- 
mine a probabilidade de que a mediana amostral esteja entre i e z 


Solução Da Equação (6.2), a densidade de X,., é dada por 


fx) = mi x(1 — x) 0O<x<l 
Assim, 
3 3/4 
Pl <Xo <5|-6[ x(1 — x) dx 
x=3/4 
DO Es nsdá 
Eee 3 16 
x=1/4 1] 


A função distribuição cumulativa de X,, pode ser obtida integrando-se a 
Equação (6.2). Isto é, 

n! 
= Du = 
Entretanto, F Xo (y) também poderia ter sido deduzida diretamente notando- 
se que a estatística de j-ésima ordem é menor ou igual a y se e somente se 


existirem j ou mais elementos do conjunto de X;s que são menores ou iguais 
a y. Assim, como o número de elementos do conjunto de X;s que são menores 


Pro) = 5 Ko [EV — Fepifod (63) 
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ou iguais a y é uma variável aleatória binomial com parâmetros n,p = F(y), 
tem-se que 


Fxo0) = PAX <= y) = Pfj ou mais elementos do conjunto de X/s são = y) 


=D (E) tro = rot (6.4) 
= 


Se, nas Equações (6.3) e (6.4), consideramos que F é uma distribuição uni- 
forme no intervalo (0, 1) [isto é, f(x) = 1,0 < x < 1], então obtemos a interes- 
sante identidade analítica 


D (ny pk n! E ET Mei 
na uy ta-grid bevel 6.5 
> Ci) ) =>no SD) Pl — attde y (6.5) 


Empregando o mesmo tipo de argumento que usamos ao estabelecer a 
Equação (6.2), podemos mostrar que a função densidade conjunta das estatís- 
ticas de ordem X,, e X,, quando i <jé 


n! = 
Digeae nn A (48) 


x Ro — Fog — Fon ifonf tp 


BoXp (Xi,Xj) = — 


para todo x, < x. 


Exemplo 6c Distribuição do alcance de uma variável aleatória 


Suponha que n variáveis aleatórias X,, X,,... X, independente e identicamente dis- 
tribuídas sejam observadas. A variável aleatória R definida como R = X,,, — Xq É 
chamada de alcance das variáveis aleatórias observadas. Se as variáveis aleatórias 
X, têm função distribuição Fe função densidade f, então a distribuição de R pode 
ser obtida a partir da Equação (6.6) da seguinte maneira: para a = 0, 


PR=<=a=PXm-— Xasa) 
ff Pray Xem X1,Xn) dx1 dXn 


Xn—x/Sa 


xi+Ha 
a fo: Elf tm) — Fey] ff (n) den dx 


Fazendo a mudança de variáveis y = F(x,) — F(x,), dy = H(x,)dx,, obtemos 


x1+a 5 FOn+tHa)-F() 
[ (FG) — FOFO) des = [ y2dy 
x 


1 
= == qlrtu + a) — Fay 
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Assim, 


[9,0] 


PR=<a)= n[ [FG + à) — Fay fa) dx (6.7) 
—00 

A Equação (6.7) pode ser avaliada explicitamente somente em poucos casos 

especiais. Um destes é quando os X;s são uniformemente distribuídos em (0, 

1). Nesse caso, obtemos, a partir da Equação (6.7), que pára0 <a < 11, 


1 
PIR<aj=n À [FG + a) — Fo) fqa) dm 


l-a 1 
=n [ al dx + n[ 1 — x) dy 
0 


—a 
=n(l- dal + a 


Derivando a equação acima, obtemos a função densidade do alcance das variá- 
veis aleatórias observadas, que é dada neste caso por 


Jnn-drZa-a 0<asl 
frta) = | 0 caso contrário 


Isto é, o alcance de n variáveis aleatórias independentes uniformes em (0,1) é 
uma variável aleatória beta com parâmetros n — 1,2. ” 


6.7 DISTRIBUIÇÃO DE PROBABILIDADE CONJUNTA 
DE FUNÇÕES DE VARIÁVEIS ALEATÓRIAS 


Sejam X, e X, variáveis aleatórias contínuas com função densidade de probabili- 

dade conjunta fx, x,- Às vezes, é necessário obter a distribuição conjunta das va- 

riáveis aleatórias Y, e Y,, que surgem como funções de X, e X,. Especificamente, 

suponha que Y, = g(X,, X,) e Y, = g(X,, X,) para algumas funções g, e g,. 
Assuma que as funções g, € g, satisfaçam as seguintes condições: 


1. As equações y, = g(X,,X,) E y, = 8>(X,, x,) podem ser unicamente solucio- 
nadas para x, € x, em termos de y, e y,, com soluções dadas por, digamos, 


x =h(P,)5).% = ho Vo). 
2. As funções g, e g, têm derivadas parciais contínuas em todos os pontos 
(x,, X,), e são tais que o determinante 2 x 2 


dg 981 
jts | CO | o ios OBA SB dEo 
ss 982 dg2 dx, dx2 dx dx1 


dx dx7 


em todos os pontos (x,, x,). 
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Nessas condições, pode-se mostrar que as variáveis aleatórias Y, e Y, são 
conjuntamente contínuas com função densidade conjunta dada por 


Fry, 01,10 = fr (1,22) Gra, xo)! (71) 


onde x, = A (Y,,)2),X, = 0), )5)- 
Uma demonstração da Equação (71) se daria nas seguintes linhas: 


PY sy,h =y)= | fx,xo (x1,x2) dxy dxz (72) 


(1x2): 
8101,X2) < 1 
8204,X2) <= 72 


A função densidade conjunta pode agora ser obtida derivando-se a Equação 
(72) em relação a y, e y,. Como este seria um exercício de cálculo avançado, 
não apresentaremos neste livro uma demonstração de que o resultado obtido é 
igual ao lado direito da Equação (7.1). 


Exemplo 7a 


Sejam X, e X, variáveis aleatórias conjuntamente contínuas com função densi- 
dade de probabilidade fx, x,. Sejam Y, = X, + X,e Y, = X, - X,. Determine a 
função densidade conjunta de Y, e Y, em termos de fx, x, 


Solução Sejam g(x,,x,)) =x, + x,€ g(x,,X,) = x, — x. Então 


1 


à ps 


1 

JOa,x2) = | 1 

Também, como as equações y, =x, +txey=x,-x, têmx, = (y, + y;)/2,x,= 
(», — Y)/2 como solução, resulta da Equação (7.1) que a densidade desejada é 


»+y2 y1 2) 


1 
Fry, 01,72) = 21%1.X ( 2 : 2 


Por exemplo, se X, e X, são variáveis aleatórias independentes e uniformes em 
(0,1), então 


1 
» O=< + <2,0= — <2 
fr, 012) = | é a! Ja o Eta 
O caso contrário 


ou,se X, e X, são variáveis aleatórias exponenciais independentes com respec- 
tivos parâmetros À, € À,, então 


Fry, (01,2) 
A1Ã2 + — 
“emp |-h (152) — À (22)] 1 +70 — 7:20 


0 caso contrário 
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Finalmente, se X, e X, são variáveis aleatórias normais padrão independentes, 
então 


fr») = 1 0142/8+01-902/8] 
TENSO 47 


= 1 gia 


4x 


Dyno 


V4m 0 4x 


Assim, não somente obtemos (em concordância com a Proposição 3.2) que X, 
+ Xe X,-X, são normais com média 0 e variância 2, mas também concluímos 
que essas duas variáveis aleatórias são independentes (de fato, pode-se mostrar 
que, se X, e X, são variáveis aleatórias independentes com mesma função de 
distribuição F, então X, + X, é independente de X, — X, se e somente se F é 
uma função distribuição normal). E 


Exemplo 7b 


Suponha que (X, Y) represente um ponto no plano, e também que as coordena- 
das retangulares X e Y sejam variáveis aleatórias normais padrão independen- 
tes. Estamos interessados na distribuição conjunta de (R, O), a representação 
de (x,y) em coordenadas polares (veja a Figura 6.4). 

Suponha primeiro que X e Y sejam ambos positivos. Para x e y positivo, 


escrevendo R = gi(x,)) = x? + y2e 0 = g(x,)) = tg! y/x, vemos que 


dg x 
à 247 
981 » 


dy 2 +y 


ô2 1 (=) Aa 
dx 1+(Wx2 Àx 2+y 
dg2 1 x 


> di+OD] 2+P 


“ 


Figura 6.4 e = Ponto aleatório. (X, Y) = (R, O). 
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Assim, 
x? yº 1 1 
106,) = 5 32 + 7d np = 
(2 + y2)3/ +72 f2+yp r 


Como a função densidade condicional de X, Y dado que essas coordenadas 
sejam ambas positivas é 


f(x,y) PA er 
X>06Y>0= = e dA 0, 0 
OS SEO nº PR 


vemos que a função densidade conjuntadeR = VX2? + Y2e0O=tg" (YIN), 
dado que as coordenadas X e Y sejam ambas positivas, é 


2 
frex >0,Y > 0)= Eae 0O<0<x/2, 0O<r<o 
x 


Similarmente, podemos mostrar que 
2 ap 
r, <06Y>0O=-re"lo, m/2<60<7T, <r<o 

fr,oIlX <0,Y > 0) /2<0 0 
mx 
2 sp 

froiX <0,Y <0=-re », x<60<37/2, 0<r<o 
Ei 
2 an 

froX >0,Y <« 0)=—re , 37/2<60<27, 0O<r<o 
bd 


Como a densidade conjunta é uma média igualmente ponderada dessas 4 den- 
sidades condicionais conjuntas, vemos que a densidade conjunta de R, O é dada 
por 


1 
fr.) = me 0 <0<2x, 0O<r<o 
Ia 


Agora, como essa densidade conjunta pode ser fatorada nas densidades mar- 
ginais de R e O, ambas as variáveis aleatórias são independentes, com € sendo 
uniformemente distribuída no intervalo (0, 27) e R tendo uma distribuição de 
Rayleigh com densidade 


fm) =rerP 0O<r<o 


(Por exemplo, quando alguém mira em um alvo em um plano, se as distân- 
cias de erro horizontais e verticais são variáveis aleatórias normais padrão 
independentes, então o valor absoluto do erro tem a distribuição de Rayleigh 
mostrada acima.) 

Este resultado é bastante interessante, pois certamente não é evidente a 
priori que um vetor aleatório cujas coordenadas são variáveis aleatórias nor- 
mais padrão independentes terá um ângulo de orientação que não somente 
é uniformemente distribuído, mas também independente de sua distância em 
relação à origem. 
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Se desejássemos a distribuição conjunta de R? e O, então, como a transfor- 
maçãod=g(x,y)="+y e0=g/x,))= tg” y'x temo Jacobiano 


2x 2y 
J = A X = 2 
x + y2 x2 + y2 


tem-se que 


f(d, 9) = l-anl qe d<o, 0<0<27 
2 2x 
Portanto, R* e O são independentes, com Rº tendo distribuição exponencial 
com parâmetro ê, Mas como Rº = Xº + Y”, tem-se por definição que Rº tem dis- 
tribuição qui-quadrado com 2 graus de liberdade. Com isso, temos uma verifi- 
cação de que a distribuição exponencial com parâmetro l é igual à distribuição 
qui-quadrado com 2 graus de liberdade. 

O resultado anterior pode ser usado para simular (ou gerar) variáveis alea- 
tórias normais fazendo-se uma transformação apropriada em variáveis alea- 
tórias uniformes. Sejam U, e U, variáveis aleatórias independentes, cada uma 
delas uniformemente distribuídas no intervalo (0, 1).Vamos transformar U, e 
U, em duas variáveis aleatórias normais X, e X, primeiro considerando a repre- 
sentação em coordenadas polares (R, O) do vetor aleatório (X,, X,). Do desen- 
volvimento anterior, Rº e O são independentes, e, além disso, R2 = x? + x? 
tem distribuição exponencial com parâmetro À = À Mas -2 logU, tem essa dis- 
tribuição, já que, para x > 0, 


P(-ZlogU, < x) =P fios U, > 5] 


=P(U, > e*2) 
=1- e 


Também, como 2%U, é uma variável aleatória uniforme em (0, 27), podemos 
usá-la para gerar O. Isto é, se fizermos 


Rº = -2logU; 
O =27U, 


então Rº é o quadrado da distância a partir da origem e 6 é o ângulo de orienta- 
ção de (X,, X,). Agora, como X, = RcosO, X, = R senf), tem-se que 


Xy=v/-2log U, cos(2m U,) 
XX =v-2log U; sen(2x U,) 


são variáveis aleatórias normais padrão independentes. mn 
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Exemplo 7c 
Se Xe Y são variáveis aleatórias gama independentes com parâmetros (a, 
A) e (B,A), respectivamente, calcule a densidade conjuntade U = X + Ye 
V=-X(X+ 7). 
Solução A densidade conjunta de X e Y é dada por 

Ae (A) pe (Ay) 


fxr(x,)) = To) T(B) 
Era SN MAN a y8 1 
P(o)P (8) 
Agora, seg (x,y) = x + y, g(x,)) = x/(x + y), então 
dx dy à (x+y2 dy Gerd)? 
então 
1 1 1 
J(x, y) Rê y =X ae mê 


(K+y2 (x +y? 


Finalmente, como as equações u = x + ye v = x/(x + y) têm como solução 
x=uvey=u(l-v),vemos que 
fuv(u,v) = fxyluv,u(l — v)Ju 
Ae (auetB-Iyoe-l(g — vê-INa + B) 
T(a + B) P(o)TN(B) 


Portanto, X + Ye X/((X + Y) são independentes, com X + Y tendo distribui- 
ção gama com parâmetros (a + B,A)e X(X + Y) tendo distribuição beta com 
parâmetros (a, 8). O raciocínio anterior também mostra que B(a, 8), o fator de 
normalização da densidade beta, é tal que 


1 
B(a,B) = / vela — v)f-ldy 
0 


— T(o)N(B) 
“T(a+B) 


Todo esse conjunto de resultados é bastante interessante. Suponha que n + m 
tarefas devam ser realizadas, cada uma (independentemente) exigindo uma 
quantidade de tempo exponencial com taxa À para ser completada. Suponha 
também que disponhamos de dois funcionários para realizar essas tarefas. O 
funcionário I cuidará das tarefas 1,2,...,n e o funcionário II cuidará das m 
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tarefas restantes. Se X e Y representam o tempo de trabalho total dos funcio- 
nários I e II, respectivamente, então (do resultado anterior ou do Exemplo 
3b), Xe Y são variáveis aleatórias gama independentes com parâmetros (n, 
A) e (m,A), respectivamente. Daí resulta que, independentemente do tempo 
necessário para que todas as n + m tarefas sejam completadas (isto é, de X + 
Y),a proporção de trabalho realizada pelo funcionário I tem distribuição beta 
com parâmetros (n,m). = 


Quando a função densidade conjunta das n variáveis aleatórias X,, X,,...,X, 
é dada e queremos calcular a função densidade conjunta de Y,, Y,,..., Y,, onde 


Y=2(X,..,X,) Y = 8X. NX). YV= 8X... X,) 


a abordagem é a mesma — isto é, supomos que as funções g, têm derivadas par- 
ciais contínuas e que o determinante do Jacobiano 


Ox1 dx2 OXn 
dgz dg2 dg2 
DS co o pic 
is rita) Ox dx dXn ! 
Ox dx2 OXn 


em todos os pontos (x,,...,x,). Além disso, supomos que as equações y, = g,(X,,..., 
XY, = 8X pes X)oees Yn = 8n6X1:-- X,) tenham uma única solução, digamos, x, 
= Apos Yo X, = AY: Yn). Sob essas hipóteses, a função densidade con- 
junta das variáveis aleatórias Y, é dada por 


Pri OL ecc 0) = Pty, oXa Oto e co OEr + ox! (73) 
onde x, = A(Yp..s Yi = 1,2,...,n. 


Exemplo 7d 


Sejam X,, X, e X, variáveis aleatórias normais padrão independentes. Se Y, = 
XN+AL+A,Y,=X-X,eY,= X,-X, calcule a função densidade conjunta 
de Y, Y,, Y.. 


Solução Fazendo-seY, =X, +XL+X,Y,=X,-X,,Y,=X,-X,,0 Jacobia- 
no dessas transformações é dado por 


1 1/1 
J=|1-1 0/=3 
1 0-1 


Como resulta das transformações precedentes que 


Y Y Y Y, — 2Y, Y: Y Y — 2Y. 
dee e So ml E É Da É 3 


3 2 3 3 
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vemos da Equação (73) que 
frio, 7301, V2, 73) 


= id, yrty+y3 y— 22 +73 Yi + — 273 
3 X1,30,X3 3 , 3 : 3 


Portanto, como 


Pr, X2,X3 01, X2, X3) = dd Di 2/2 
vemos que 
Fry AOL 2» Y) = sapo Ono 
onde 
Q(01,)2,)3) 


Any 1-2 +93Y n+y—Y 
=(D> 2 S)4(>D> DD —)4(-——— 
3 3 3 
2 
E Mn e dem RD 
= + 322 + 3/3 3723 = 
Exemplo 7e 
Sejam X,, X,...., X, variáveis aleatórias exponenciais com taxa À independentes 
e identicamente distribuídas. Seja 
Y=XM+.+X i=l,n 


(a) Determine a função densidade conjunta de Y,,..., Y,. 
(b) Use o resultado da letra (a) para determinar a densidade de Y,. 


Solução (a) O Jacobiano das transformações Y, = X,Y, =X, + As Y,= 
NX ++ X é 


10 0 0 0 
11 0 0. 0 
= a 11 0 0 
1111-001 


Como somente o primeiro termo do determinante será diferente de zero, temos 
J = 1. Agora, a função densidade conjunta de X,,..., X, é dada por 


n 
ras Cope sea) = | [e O<x<o,i=l,...,n 
i=1 
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Assim, como as transformações anteriores levam a 


efe Va VM E Ver; 


resulta da Equação (73) que a função densidade conjunta de Y,,..., Y, é 


Fri. 01,2: 5 Yn) 
= Pe 00 Disse ES Vias cada — Pnad) 


n 
=M"exp(-A|y1 + ) 0: — yi1) 

oa 
=Me*m 0O<y,0<y-Yy-ni=2.snh 
= Ate 0 <»m <Y<e <Ya 


z 


(b) Para obter a densidade marginal de Y,, vamos integrar as demais variáveis 


uma de cada vez. Ao fazer isso, obtemos 
DE ar 
Pro OD ces Yn) — / À e *" dy 
0 
= Nye” Mn 0 < <<< 


Continuando, obtemos 
48 n —AY, 
Pan (3 eco Yn) af Nyoe “dy, 


2 
= de O<y<y<o<)n 


A próxima integração resulta em 
3 
Ya 
na Yn 
À 3 e 


Fran O4o sn) = 0 « Ya << 


Continuando dessa maneira, obtemos 


n—1 
fr; On) o 0 <yn 


o que, em concordância com o resultado obtido no Exemplo 3b, mostra que X, 


+... + X, é uma variável aleatória gama com parâmetros ne À. 


*6.8 VARIÁVEIS ALEATÓRIAS INTERCAMBIÁVEIS 


As variáveis aleatórias X,, X,,..., X, são chamadas de intercambiáveis se, para 


cada permutação i,...., 1, dos inteiros 1,...,n, 
BI E RÃ É, es 


n 


=mm=sPM<a,Ãão =x... sÃan E Xn) 
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para todo x,,..., x,. Isto é, as n variáveis aleatórias são intercambiáveis se sua 
distribuição conjunta é igual independentemente da ordem em que as variáveis 
são observadas. 

Variáveis aleatórias discretas são intercambiáveis se 


PX, =1,Ã,=12.. 4, =*in)=PMMX =1,,Ã2=%2,..00Xn =X) 


para todas as permutações i,,..., i, € todos valores x,,..., ,,- Isso é equivalente 
a dizer que p(x,,x,,...,X,)) = PIX, = x,,..., X, = x,) é uma função simétrica do 


vetor (x,,...,X,), O que significa que seu valor não muda quando os elementos do 
vetor são permutados. 


Exemplo 8a 


Suponha que bolas sejam retiradas uma de cada vez e sem reposição de uma 
urna que contém inicialmente n bolas, das quais k são consideradas especiais, 
de tal maneira que cada bola retirada tenha a mesma probabilidade de ser qual- 
quer uma das bolas na urna. Se a i-ésima bola retirada é especial, então X, = 1; 
caso contrário, X, = O. Vamos mostrar que as variáveis aleatórias X,...., X, são 
intercambiáveis. Para fazer isso, suponha que (x,...., x,) seja um vetor formado 
por k uns e n — k zeros. Entretanto, antes de considerar a função discreta de 
probabilidade conjunta avaliada em (x,....,x,), vamos tentar entender melhor o 
problema ao considerar um vetor fixo — por exemplo, considere o vetor (1,1,0, 
1,0,...,0, 1), que se supõe conter k uns e n — k zeros. Então, 


kk -Iln-kk-2n-k-—-1 11 
nn-1In-—-2n-3 n-4 21 


p(1,1,0,1,0,...,0,D = 


que é obtida porque a probabilidade de que a primeira bola seja especial é 
igual a k/n,a probabilidade condicional de que a próxima seja especial é igual a 
(k — 1)/(n — 1), a probabilidade condicional de que a bola seguinte não seja es- 
pecial é igual a (n — k)/(n — 2), e assim por diante. Usando o mesmo argumento, 
tem-se que p(x,,...,x,) pode ser escrita como o produto de n frações. Os termos 
sucessivos do denominador dessas frações variam de n a 1. O termo do numera- 
dor no ponto em que o vetor (x,,...,x,) éiguala 1 pelai-ésima vezék —-(i-1),e 
onde ele é O pela i-ésima vez é igual a n — k (i — 1). Portanto, como o vetor (x,...., 
x,) é formado por k uns e n — k zeros, obtemos 
ki(n — k)! 


Rn 
Plipsesdnh=" o Hei uk 
i=l 


Como essa é uma função simétrica de (x,,...,x,), tem-se que as variáveis aleató- 
rias são intercambiáveis. E 


Observação: Outra maneira de se obter a fórmula anterior para a fun- 
ção discreta de probabilidade conjunta é tratar as n bolas como se fossem 
diferentes umas das outras. Então, como o resultado do experimento é uma 
ordenação dessa bolas, tem-se que existem n! resultados igualmente prová- 
veis. Finalmente, como o número de resultados com bolas especiais e não es- 
peciais em posições especificadas é igual ao número de maneiras que há de se 
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permutar as bolas especiais e não especiais entre si, isto é, k!(n — k)!, obtemos 
a função densidade anterior. [| 


Vê-se facilmente que, se X,, X,,..., X, são intercambiáveis, então cada X, 
tem a mesma distribuição de probabilidade. Por exemplo, se X e Y são variáveis 
aleatórias discretas intercambiáveis, então 


PR=j=) Pi=er=yj=> BX=yY==P=4) 
y ba 


Por exemplo, obtém-se do Exemplo 8a que a i-ésima bola retirada será especial 
com probabilidade k/n, o que é intuitivamente claro, já que cada uma das n bo- 
las tem a mesma probabilidade de ser a i-ésima bola selecionada. 


Exemplo 8b 


No Exemplo 8a, suponha que Y, represente o número de seleção da primeira bola 
especial retirada da urna, e Y, o número adicional de bolas retiradas em seguida 
até que uma segunda bola especial seja retirada. Em geral, suponha que Y, repre- 
sente o número adicional de bolas retiradas após a seleção da (i — 1)-ésima bola 
especial até que a i-ésima bola especial seja selecionada, i = 1,..., k. Por exemplo, se 
n=4,k=-2eX,=1,4,=0,X,=0,X,=1,entãoY,=1,Y,=3.Agora,Y,=i, 


D = bs = 4 O Mi = Mitig=.. = Xi+.+iy = 1,X, = 0,caso contrário; assim, 
a partir da função discreta de probabilidade conjunta de X, obtemos 
: : : kn — 9! . 
Ph =ipf=i. Paio E ittipçen 


Portanto, as variáveis aleatórias Y,,..., Y, são intercambiáveis. Note que, como 
resultado disso, o número de cartas que uma pessoa deve selecionar de um ba- 
ralho bem-embaralhado até que apareça um ás tem a mesma distribuição que 
o número de cartas adicionais que esta mesma pessoa deve selecionar após a 
seleção do primeiro ás até que o próximo ás apareça, e assim por diante. a 


Exemplo 8c 


A seguir consideramos o problema conhecido como o modelo da urna de 
Polya: suponha que uma urna contenha inicialmente n bolas vermelhas e m 
bolas azuis. Em cada etapa do experimento, uma bola é sorteada, sua cor é ano- 
tada, e ela é então recolocada junto com outra bola da mesma cor. Considere 
X, = 1 se a i-ésima bola sorteada for vermelha, e X, = 0 se a bola for azul, i > 
1. Para que tenhamos uma idéia a respeito das probabilidades conjuntas dessas 
variáveis aleatórias X;'s, observemos os casos especiais a seguir: 


PX,=1,XM=),43=0,X=1,X5=0) 
n n+1 m n+2 m-+1 


nAtmant+m4+tlInt+m+2n+m+3In4+4m+44 
n(n + D(an + Dmm + 1) 


nr+mn+m+Dn+m+D)n+Am+4+DA+mA4 4 
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P(X,=06,X,=,4=0,X =LAXs=1) 
m n m+1 n+1 n+2 


“Cntmn+m+Aln+m+Intm+In+m+4 
= n(n + D(n + Dmm + 1) 
“ntmntmAtDn+AMmADn+AMm+n+m+ 4a) 


Pelo mesmo raciocínio, para qualquer sequência x,,..., x, que contenha r uns e 
k — r zeros, temos 
PM =x1,...,Xk = Xk) 
on + DG pr > Dmbm + Dem dk == DB) 
o nem (n+m+k—1) 


Portanto, para qualquer valor de k, as variáveis aleatórias X,,..., X, são in- 
tercambiáveis. 

Um corolário interessante referente à permutabilidade neste modelo é o de 
que a probabilidade de que a i-ésima bola sorteada seja vermelha é igual à proba- 
bilidade de que a primeira bola sorteada seja vermelha, isto é, E. (para um argu- 
mento intuitivo para esse resultado inicialmente não intuitivo, imagine que todas 
as n + m bolas inicialmente na urna sejam de tipos diferentes. Isto é, uma é uma 
bola vermelha do tipo 1, outra é uma bola vermelha do tipo 2,..., outra é uma bola 
vermelha do tipo n, uma é uma bola azul do tipo 1, e assim por diante, até uma 
bola azul do tipo m. Suponha que, após o sorteio de uma bola, ela seja recolocada 
junto com outra bola da mesma cor. Então, por simetria, a i-ésima bola sorteada 
tem a mesma probabilidade de ser qualquer uma daquelas de n + m tipos distin- 


tos. Como n desses n + m tipos são bolas vermelhas, a probabilidade é 2). ER 


Nosso exemplo final lida com variáveis aleatórias contínuas que são in- 
tercambiáveis. 


Exemplo 8d 
Sejam X,, X,,.... X, variáveis aleatórias independentes uniformes em (0,1), e 
represente suas estatísticas de ordem como X,,,,..., X,). Isto é, X néa j-ésima 


menor dentre as variáveis X,, X,,...X,. 
Também considere 


NY =X, 
Y=Xo-— Xiry i=2,...n 
Mostre que Y,,..., Y, são intercambiáveis. 
Solução As transformações 
NS sy SM, i=2,.5n 


resultam em 
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Como é fácil notar que o Jacobiano das transformações anteriores é iguala 1, 
então obtemos, da Equação (73), 


Pr OL co) = + ps) e + a) 


onde f é a função densidade conjunta das estatísticas de ordem. Portanto, da 
Equação (6.1), obtemos 


fr RES HOLY sIn)=n! O<y<yty<oee<y+H+Hy<l 


ou, equivalentemente, 


rm OLL sIn)=m O<y<li=1.n py+te+ya<l 


Como a densidade conjunta anterior é uma função simétrica de y,,..., ),» Vemos 
que as variáveis aleatórias Y,,..., Y, são intercambiáveis. = 


RESUMO 


A função distribuição de probabilidade cumulativa conjunta do par de variáveis 
aleatórias X e Y é definida como 


Fo,y)=PMX=<xY=<o)) —- 0 <x,)<o 
Todas as probabilidades relacionadas a esse par de variáveis aleatórias podem 


ser obtidas de F. Para obter as funções distribuição de probabilidade indivi- 
duais de Xe Y, use 


Fx() = io Fo,y) Fy0)= lim Fo,y) 
Se Xe Y são ambas variáveis aleatórias discretas, então sua função discreta 
de probabilidade conjunta é definida como 
pú,)=PX=iY=)) 
As funções discretas de probabilidade individuais são 


PX=)=) p6D PlW=j=> pt) 


J 


As variáveis aleatórias X e Y são chamadas de conjuntamente contínuas se 
existe uma função f(x, y), chamada de função densidade de probabilidade con- 
junta, tal que, para qualquer conjunto bidimensional €, 


PUX,M) e C)= fra» dx dy 
c 


Resulta da fórmula anterior que 


Px<X,x+dxy<Y<y+dy)=flxy)dxdy 
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Se Xe Ysão variáveis aleatórias conjuntamente contínuas, então elas são indi- 
vidualmente contínuas com funções densidade 


fe) = / fendy fry= A f(x,y) de 


As variáveis aleatórias X e Y são independentes se, para todos os con- 
juntos 4 e B, 


PIXEA,YEB|=P[XEAP|YEB) 


Se a função distribuição conjunta (seja a função de probabilidade conjunta no 
caso discreto ou a função densidade conjunta no caso contínuo) puder ser fato- 
rada em uma parte que depende somente de x e em outra que depende somen- 
te de y, então X e Y são independentes. 

Em geral, as variáveis aleatórias X,,..., X, são independentes se, para todos 
os conjuntos de números reais 4,....,A,, 


PIX,EA,..X €AJ=P(X,€A..PX EA) 


Se Xe Y são variáveis aleatórias contínuas independentes, então a função dis- 
tribuição de sua soma pode ser obtida a partir da identidade 


Fetd= / Fx(a — yfyQdy 


Se X, 1,...,n, são variáveis aleatórias normais independentes com po 
parâmetros u, e oZ,i = 1,..,n, então). X; é normal com parâmetros a Hi e» o? 


=1 =1 
Se X, 1,...,n,são variáveis aleatórias de Poisson independentes com respec- 


tivos arielcs Api = 1,..,n, então » X; é Poisson com parâmetro E Ai. 
i=1 
Se Xe Ysão variáveis aleatórias discretas, então a função de robabiidaãE 


condicional de X dado que Y = y é definida por 
PQ) 
PryQ) 


onde p é sua função de probabilidade conjunta. Também, se X e Y são conjun- 
tamente contínuas com função densidade conjunta f, então a função densidade 
de probabilidade condicional de X dado que Y = y é dada por 


Ff, y) 
fr) 


Os valores ordenados X,,, = X, <... X,», de um conjunto de variáveis aleatórias 
normais independentes e identicamente distribuídas são chamados de estatísti- 
cas de ordem do conjunto. Se as variáveis aleatórias são contínuas e têm função 
densidade f, então a função densidade conjunta das estatísticas de ordem é 


FO... XxX) = n!f(x)---f(xa) MENS EX 


PX=xY=y)j=>———— 


xy ly) = 


As variáveis aleatórias X,,..., X, são chamadas de intercambiáveis se a distribui- 
ção conjunta de X;,,..., X;, é a mesma para toda permutação i,,...,i, de 1,...,n 
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PROBLEMAS 


6.1 Dois dados honestos são rolados. Deter- 
mine a função de probabilidade conjunta 
de Xe Y quando 
(a) X é o maior valor obtido em um dado 
e Yé a soma dos valores; 

(b) X é o valor no primeiro dadoe Y é o 
maior dos dois valores; 

(c) Xé o menor e Y é o maior valor obti- 
do com os dados. 

6.2 Suponha que 3 bolas sejam sorteadas 
sem reposição de uma urna consistindo 
em 5 bolas brancas e 8 bolas vermelhas. 
Considere X,=1 caso a i-ésima bola se- 
lecionada seja branca e X,=0 caso con- 
trário. Dê a função de probabilidade 
conjunta de 
(a) X, X; 

(D) X,, XX. 

6.3 No Problema 6.2, suponha que as bolas 
brancas sejam numeradas e considere Y, 
= 1 se a i-ésima bola branca for selecio- 
nada, e O caso contrário. Determine a fun- 
ção de probabilidade conjunta de 
(a) Y,);; 

(D) Y5Y,,Y,. 

6.4 Repita o Problema 6.2 quando a bola se- 
lecionada é recolocada na urna antes da 
próxima seleção. 

6.5 Repita o Problema 6.3a quando a bola se- 
lecionada é recolocada na urna antes da 
próxima seleção. 

6.6 Sabe-se que um cesto com 5 transistores 
contém 2 com defeito. Os transistores de- 
vem ser testados, um de cada vez, até que 
os defeituosos sejam identificados. Supo- 
nha que N, represente o número de testes 
feitos até que o primeiro transistor defei- 
tuoso seja identificado e N, o número de 
testes adicionais feitos até que o segundo 
transistor defeituoso seja identificado. 
Determine a função de probabilidade 
conjunta de N, e N.. 

6.7 Considere uma sequência de tentativas 
de Bernoulli independentes, cada uma 
com probabilidade de sucesso p. Sejam 
X, o número de fracassos precedendo o 
primeiro sucesso e X, o número de fra- 
cassos entre os dois primeiros sucessos. 
Determine a função de probabilidade 
conjunta de X, e X,. 


6.8 A função densidade de probabilidade 

conjunta de X e Y é dada por 
fop)=(-"0e" -y=a=y,0<y<o 
(a) Determine c. 
(b) Determine as densidades marginais 
deXeyY. 

(c) Determine E[X]. 

6.9 A função densidade de probabilidade 
conjunta de X e Y é dada por 


fe =5 (2 + 3) O<x<1,0<y<2 


(a) Verifique que esta é de fato uma fun- 
ção densidade conjunta. 
(b) Calcule a função densidade de X. 
(c) Determine P(X > Y). 
(d) Determine P(Y > X < 5. 
(e) Determine E[X]. 
(£f) Determine E[Y]. 
6.10 A função densidade de probabilidade 
conjunta de X e Y é dada por 


p=” 0<x<o,0<y<o 


Determine (a) P(X < YJe (b) P(X < a) 

6.11 O proprietário de uma loja de televisores 
imagina que 45% dos clientes que entram 
em sua loja comprarão um televisor co- 
mum, 15% comprarão um televisor de 
plasma e 40% estarão apenas dando uma 
olhada. Se 5 clientes entrarem nesta loja 
em um dia, qual é a probabilidade de que 
ele venda exatamente 2 televisores co- 
muns e 1 de plasma naquele mesmo dia? 

6.12 O número de pessoas que entram em uma 
farmácia em certo horário é uma variável 
aleatória de Poisson com parâmetro À = 
10. Calcule a probabilidade condicional 
de que no máximo 3 homens tenham en- 
trado na farmácia dado que 10 mulheres 
entraram naquele momento. Que hipóte- 
ses você adotou? 

6.13 Um homem e uma mulher combinam um 
encontro em certo lugar às 12:30. Se o 
homem chega em um horário uniforme- 
mente distribuído entre 12:15 e 12:45,e se 
a mulher chega independentemente entre 
12:00 e 13:00, determine a probabilidade 
de que o primeiro a chegar não espere 
mais de 5 minutos. Qual é a probabilidade 
de que o homem chegue primeiro? 
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6.14 Uma ambulância viaja em ambos os sen- 
tidos de uma estrada de comprimento L 
com velocidade constante. Em certo ins- 
tante de tempo, um acidente ocorre em 
um ponto uniformemente distribuído 
na estrada [isto é, a distância do local do 
acidente até um dos pontos fixos no final 
da estrada é uniformemente distribuída 
ao longo de (0, L)]. Supondo que a loca- 
lização da ambulância no momento do 
acidente também seja uniformemente dis- 
tribuída e que as variáveis sejam indepen- 
dentes, calcule a distribuição da distância 
da ambulância até o local do acidente. 

6.15 O vetor aleatório (X, Y) é chamado de 
uniformemente distribuído em uma re- 
gião R do plano se, para alguma constan- 
te c, sua densidade conjunta é 


= c se (x, 7) ER 
f,y) = Ê caso contrário 


(a) Mostre que 1/c = área da região R. 
Suponha que (X, Y) seja uniforme- 
mente distribuído ao longo do qua- 
drado centrado em (0, 0) e com lados 
de comprimento 2. 

(b) Mostre que X e Y são independentes, 
com cada um sendo uniformemente 
distribuído ao longo de (-1,1). 

(c) Qual é a probabilidade de que (X, 
Y) esteja contido no círculo de raio 1 
centrado na origem? Isto é, determine 
PO +Y <a). 

6.16 Suponha que n pontos sejam independen- 
te e aleatoriamente escolhidos na borda 
de um círculo e que queiramos determi- 
nar a probabilidade de que eles estejam 
no mesmo semicírculo. Isto é, queremos 
a probabilidade de que exista uma linha 
passando pelo centro do círculo tal que to- 
dos os pontos estejam de um lado da linha, 
conforme mostrado no diagrama a seguir 
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Suponha que ?,,..., P, representem os n 
pontos. Suponha também que A repre- 
sente o evento em que todos os pontos 
estão contidos em algum semicírculo co- 
meçando no ponto P, seguindo no sentido 
horário por 180º,i = 1,...,n. 

(a) Expresse A em termos de 4,. 

(b) São os A;s mutuamente exclusivos? 
(c) Determine P(A). 

6.17 Três pontos X,, X,, X, são selecionados 
aleatoriamente em uma linha L. Qual é 
a probabilidade de que X, esteja entre 
Xe X;? 

6.18 Dois pontos são selecionados aleatoria- 
mente em uma linha de comprimento 
L de forma a estarem em lados opostos 
do ponto central dessa linha [em outras 
palavras, os dois pontos X e Y são variá- 
veis aleatórias independentes tais que X 
é uniformemente distribuída ao longo de 
(0, L/2) e Y é uniformemente distribuída 
ao longo de (L/2, L)]. Determine a proba- 
bilidade de que a distância entre os dois 
pontos seja maior que L/3. 

6.19 Mostre que f(x,y) = 1/x,0<y<x<1é 
uma função densidade conjunta. Supon- 
do que fseja a função densidade conjunta 
de X, Y, determine 
(a) a densidade marginal de Y; 

(b) a densidade marginal de X; 


(c) E(X]; 
(a) ELY] 
6.20 A densidade conjunta de X e Y é dada por 
Jr ED o x>0,y>0 
f05)) = f caso contrário 


Xe Y são independentes? Se, em vez dis- 
so, f(x, y) fosse dada por 


fe = 0O<x<y0<y<l 


caso contrário 


Xe Y seriam independentes? 
6.21 Seja 


fwy)=24xy 0<x=1,0=y<1,0=x+y<1 


e f(x,y) = 0 caso contrário. 

(a) Mostre que f(x, y) é uma função den- 
sidade de probabilidade conjunta. 

(b) Determine E[X]. 

(c) Determine E[Y]. 
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6.22 A função densidade conjunta de X e Y é 
oJx+ty 0<x<1,0<y<1l 
Fo) = lo caso contrário 


(a) Xe Y são independentes? 
(b) Determine a função densidade de X. 
(c) Determine P(X + Y<1) 

6.23 As variáveis aleatórias X e Y têm função 
densidade conjunta 

fox,y)=12xy(1-x) 0<x<1,0<y<1 

e f(x,y) = O caso contrário. 
(a) Xe Y são independentes? 
(b) Determine E[X]. 
(c) Determine E[Y]. 
(d) Determine Var(X). 
(ec) Determine Var(Y). 

6.24 Considere tentativas independentes, 
cada uma delas levando ao resultado 
ii =0,1,.., k, com probabilidade p,, 


k 
5 pi = 1. Suponha que N represente o 
i=0 


número de tentativas necessárias para 

que se obtenha um resultado diferente 

de 0, e chame de X este resultado. 

(a) Determine P(N = n),n=>1. 

(b) Determine P(X = j),j=1,...,k. 

(c) Mostre que P(N =n,X =j)= P(N= 
njP(X = 5) 

(d) E intuitivo para você que N seja inde- 
pendente de X? 

(e) É intuitivo para você que X seja inde- 
pendente de N? 

6.25 Suponha que 10º pessoas cheguem em 
uma parada de ônibus em horários que 
são variáveis aleatórias independentes, 
cada um dos quais uniformemente dis- 
tribuído ao longo de (0, 10º). Seja N o 
número de pessoas que chegam na pri- 
meira hora. Determine uma aproxima- 
ção para P(N = il. 

6.26 Suponha que 4, B e C sejam variáveis 
aleatórias independentes, cada uma delas 
uniformemente distribuída em (0,1). 

(a) Qual é a função distribuição cumula- 
tivade 4,Be €? 

(b) Qual é a probabilidade de que todas as 
raízes da equação AX + Bx+ C=0 
sejam reais? 

6.27 Se X, e X, são variáveis aleatórias expo- 
nenciais independentes com respectivos 
parâmetros, e À,, determine a distribuição 
de Z = X/X,. Também calcule P(X, < X,). 


6.28 O tempo necessário para que um carro 
seja abastecido é uma variável aleatória 
exponencial com parâmetro 1. 

(a) Se José traz o seu carro no instante O 
e Maria no instante +, qual é a proba- 
bilidade de que o carro de Maria seja 
abastecido antes do carro de José? 
(Suponha que o tempo de abasteci- 
mento seja independente do horário 
de chegada do carro.) 

(b) Se ambos os carros chegarem no ins- 
tante O, com o abastecimento come- 
çando no carro de Maria somente 
quando o abastecimento do carro de 
José já tiver terminado, qual é a pro- 
babilidade de que o carro de Maria 
esteja pronto antes de t = 2? 

6.29 A venda bruta semanal de certo restau- 
rante é uma variável aleatória normal 
com média R$2.200 e desvio padrão 
R$230. Qual é a probabilidade de que 
(a) a venda bruta total ao longo das pró- 

ximas 2 semanas exceda R$5.000? 

(b) a venda semanal exceda R$2.000 em 
pelo menos 2 das próximas 3 semanas? 

Quais são as hipóteses de independência 

que você fez? 

6.30 A pontuação de Carlos no boliche é nor- 
malmente distribuída com média 170 e 
desvio padrão 20, enquanto a de Sebas- 
tião é normalmente distribuída com mé- 
dia 160 e desvio padrão 15. Se Carlos e 
Sebastião jogam um jogo cada, obtenha, 
supondo que suas pontuações sejam va- 
riáveis aleatórias independentes, a proba- 
bilidade aproximada de que 
(a) a pontuação de Carlos seja maior. 

(b) o total de seus pontos supere 350, 

6.31 De acordo com o Centro Nacional para 
Estatísticas de Saúde dos EUA, 25,2% 
dos homens e 23,6% das mulheres nun- 
ca tomam café da manhã. Suponha que 
amostras aleatórias de 200 homens e 200 
mulheres sejam escolhidas. Obtenha a 
probabilidade de que 
(a) pelo menos 110 dessas 400 pessoas 

nunca tomem café da manhã; 

(b) o número de mulheres que nunca to- 
mam café da manhã seja pelo menos 
tão grande quanto o número de homens 
que nunca tomam café da manhã. 

6.32 O número esperado de erros tipográficos 
em uma página de certa revista é igual a 2. 
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Qual é a probabilidade de que um artigo 
de 10 páginas contenha (a) 0 e (b) 2 ou 
mais erros tipográficos? Explique o seu 
raciocínio. 

6.33 O número médio mensal de acidentes aé- 
reos em todo o mundo é igual a 2,2. Qual 
é a probabilidade de que ocorram 
(a) mais de 2 acidentes aéreos no próxi- 

mo mês? 
(b) mais de 4 acidentes aéreos nos próxi- 
mos 2 meses? 


(c) mais de 5 acidentes aéreos nos próxi- - 


mos 3 meses? 

Explique o seu raciocínio. 

6.34 Pedro tem duas tarefas a cumprir, uma 
logo após a outra. Cada tentativa na ta- 
refa i leva uma hora e tem probabilidade 
de sucesso p;. Se p, = 0,3 e p, = 0,4, qual 
é a probabilidade de que Pedro precise de 
mais de 12 horas para completar ambos 
os trabalhos de forma bem-sucedida? 

6.35 No Problema 4, calcule a função de pro- 
babilidade condicional de X, dado que 
(a) X,=1; 

(b) X,=0. 

6.36 No Problema 3, calcule a função de pro- 
babilidade condicional de Y, dado que 
(a) Y,=1; 

(b) Y,=0. 

6.37 No Problema 5, calcule a função de pro- 
babilidade condicional de Y, dado que 
(a) M=1; 

(b) Y,=0. 

6.38 Escolha aleatoriamente um número X a 
partir do conjunto de números [1,2,3, 
4,5). Escolha agora, do subconjunto for- 
mado por números que não são maiores 
que X, isto é, de (1,..., X], um novo nú- 
mero de forma aleatória. Chame de Y 
este segundo número. 

(a) Determine a função de probabilidade 
conjunta de Xe Y. 

(b) Determine a função de probabilidade 
condicional de X dado Y = i. Faça-o 
parai=1,2,3,4,5. 

(c) Xe Y são independentes? Por quê? 

6.39 Dois dados são rolados. Suponha que X e 
Y representem, respectivamente, o maior 
e o menor valor obtido. Calcule a função 
de probabilidade condicional de Y dado 
que X=i parai=1,2...,6.São Xe Y 
independentes? Por quê? 
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6.40 A função de probabilidade conjunta de X 
e Y é dada por 


PA, = Pp, = 


th ol 
[a gap 


PQ) = PQ,2) = 


8 2 


(a) Calcule a função de probabilidade con- 
dicional de X dado que Y = i,i= 1,2. 
(b) Xe Y são independentes? 
(c) Calcule PIXY = 3, PX + Y>2, 
PIXIY >1). 
6.41 A função densidade conjunta de Xe Y é 
dada por l 


fx,3) = 207 


(a) Determine a densidade condicional 
de X, dado que Y = y,e aquela de Y, 


x>0,y>0 


dado que X = x. 
(b) Determine a função densidade de Z = 
XY. 


6.42 A densidade conjunta de Xe Y é 
fep=("-yDe 0sx<m,-rsy<o 


Determine a distribuição condicional de 
Y, dado que X = x. 

6.43 Uma companhia de seguros supõe que 
cada pessoa tenha um parâmetro de aci- 
dentes, e que o número anual de acidentes 
sofridos por alguém é uma variável alea- 
tória de Poisson com parâmetro A. Supõe 
também que o parâmetro associado a um 
novo segurado pode ser representado por 
uma variável aleatória com distribuição 
gama e parâmetros s e «. Se uma nova se- 
gurada sofre n acidentes em seu primeiro 
ano, determine a densidade condicional 
de seu parâmetro de acidentes. Também, 
determine o número esperado de aciden- 
tes que ela sofrerá no próximo ano. 

6.44 Se X,, X,, X, são variáveis aleatórias in- 
dependentes uniformemente distribuídas 
ao longo de (0,1), calcule a probabilidade 
de que a maior das três seja a soma das 
outras duas. 

6.45 Uma máquina complexa é capaz de ope- 
rar corretamente desde que 3 de seus 5 
motores estejam funcionando. Se cada 
motor funciona independentemente por 
um tempo aleatório com função densi- 
dade f(x) = xe”,x > 0, calcule a função 
densidade da duração de tempo em que a 
máquina funciona. 
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6.46 Se 3 caminhões quebram em pontos alea- 
toriamente distribuídos em uma estrada de 
extensão L, determine a probabilidade de 
que dois desses caminhões não estejam a 
uma distância d entre si quando d = L/2. 

6.47 Considere uma amostra de tamanho 5 
retirada de uma distribuição uniforme ao 
longo de (0,1). Calcule a probabilidade de 


que a mediana esteja no intervalo (4. 3) 


6.48 Se X,X,, X, X,e X,são variáveis aleató- 
rias exponenciais independentes e iden- 
ticamente distribuídas com parâmetro A, 
calcule 
(a) Pfmin(X,...., X,) = a) 

(b) Plmáx(X,...., X,) = a) 

6.49 Sejam X,, Xoy--» Xçn) àS estatísticas de 
ordem de um conjunto de n variáveis 
uniformes independentes no intervalo 
(0, 1). Determine a distribuição condi- 
cional de X,,, dado que X,, = S,, Xç) = 
So, Man) Sa 

6.50 Sejam Z, e Z, variáveis aleatórias nor- 
mais padrão independentes. Mostre que 
X, Y tem uma distribuição normal biva- 
riada quando X =Z eY=2Z, + 2Z,. 

6.51 Deduza a distribuição do alcance de uma 
amostra de tamanho 2 de uma distribuição 
com função densidade f(x) = 2x,0<x<1 

6.52 Suponha que X e Y representem as coor- 
denadas de um ponto aleatoriamente es- 
colhido em um círculo de raio 1 centrado 
na origem. Sua densidade conjunta é 


fx, y) = Um 


Determine a função densidade conjunta 
das coordenadas polares R = (Xº + Y)”º 
cO=tg' y/X. 

6.53 Se Xe Y são variáveis aleatórias indepen- 
dentes uniformemente distribuídas ao longo 
de (0, 1), determine a função densidade 
conjuntadeR =X? + Y2eO=tg' YIX. 

6.54 Se U é uniforme em (0, 27) e Z, indepen- 
dentemente de U, é exponencial com taxa 
1, mostre diretamente (sem usar os resul- 


X+y<l 


tados do Exemplo 7b) que X e Y defini- 
dos por 


X=v2ZcosU 
Y=v2ZsenU 


são variáveis aleatórias normais padrão 
independentes. 
6.55 Xe Y têm a função densidade conjunta 


fe) = x=1,y21 


(a) Calcule a função densidade conjunta 
deU=XY,V=X/Y 

(b) Quais são as densidades marginais? 
6.56 Se X e Y são variáveis aleatórias unifor- 

mes em (0, 1) independentes e identica- 

mente distribuídas, calcule a densidade 

conjunta de 

(a) U=X+Y,V= x; 

(b) U=A,V= XIV; 

() U=X+Y,V=X(X+ 7). 


. 6.57 Repita o Problema 6.56 quando X e Y são 


variáveis aleatórias exponenciais inde- 
pendentes, cada uma com parâmetro À. 

6.58 Se X, e X, são variáveis aleatórias expo- 
nenciais independentes, cada uma com pa- 
râmetro À, determine a função densidade 
conjuntade Y, =X, + X,e Y,= exp(X,). 

6.59 Se X, Y,e Z são variáveis aleatórias inde- 
pendentes com mesma função densidade 
f(x) = e *,0<x < 0, deduza a distribui- 
çãoconjuntade U=X+Y,V=-X+2Z, 
W=Y+2Z. 

6.60 no Exemplo 8b, faça Y,, = n+1- 
> Yi Mostre que Y,...., Y,, Y,. São inter- 
= 
cambiáveis. Note que Y,.., é o número de 
bolas que alguém deve observar até obter 
uma bola especial caso seja considerada a 
ordem de retirada inversa. 

6.61 Considere uma urna contendo n bolas 
numeradas 1...., n e suponha que k des- 
sas bolas sejam sorteadas. Faça X,= 1 se a 
bola número i for sorteada, e X,= O caso 
contrário. Mostre que X,...., X, são inter- 
cambiáveis. 


EXERCÍCIOS TEÓRICOS 


6.1 Verifique a Equação (1.2). 
6.2 Suponha que o número de eventos que 
ocorrem em um dado período de tempo 


seja uma variável aleatória de Poisson com 
parâmetro À. Se cada evento é classificado 
como sendo do tipo i com probabilidade p,, 
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i=1,..n,))p; = 1 independentemente dos 
demais eventos, mostre que os números de 
eventos do tipo i que ocorrem, i = 1....n, 
são variáveis aleatórias de Poisson inde- 
pendentes com parâmetros Ap, i = 1,...,n. 

6.3 Sugira um procedimento que use o pro- 
blema da agulha de Buffon para estimar 
q. Surpreendentemente, este já foi um 
método comum de se avaliar 7. 

6.4 Resolva o problema da agulha de Buffon 
quando L > D. 


Resposta: a — sen6) + 26/m, onde 
x 


cos 6 = D/L. 

6.5 Se Xe Y são variáveis aleatórias inde- 
pendentes, positivas e contínuas, escreva 
a função densidade de (a) Z = X/Y e (b) 
Z = XY em termos das funções densida- 
de de X e Y. Avalie as funções densidade 
no caso especial onde X e Y são ambas 
variáveis aleatórias exponenciais. 

6.6 Se Xe Y são variáveis aleatórias conjun- 
tamente contínuas com função densidade 
feylx, y), mostre que X + Y é contínua 


com função densidade 
00 


fxert)= | fxylst — x)dx 
—00 
6.7 (a) Se X tem distribuição gama com pará- 
metros (t,A), qual é a distribuição de 
cX,c>0? 
(b) Mostre que 
La 
2x *2n 


tem distribuição gama com parâmetros n, 
À quando n é um inteiro positivo e x2, é 
uma variável aleatória qui-quadrado com 
2n graus de liberdade. 

6.8 Sejam X e Y variáveis aleatórias inde- 
pendentes contínuas com respectivas 
funções taxa de risco À (t) e Ay(t), e esta- 
beleça W = min(X, Y). 

(a) Determine a função distribuição de 
W em termos daquelas de Xe Y. 

(b) Mostre que A (1), a função taxa de ris- 
co de W, é dada por 


Aki) = Axl) + At) 


6.9 Sejam X,,..., X, variáveis aleatórias expo- 
nenciais independentes com parâmetro 
comum A. Determine a distribuição de 
min(X,...., X,). 


6.10 Os tempos de vida de pilhas são variáveis 
aleatórias exponenciais independentes, 
cada uma com parâmetro alfa. Uma lan- 
terna precisa de 2 pilhas para funcionar. 
Se alguém tem uma lanterna e uma saco- 
la com n pilhas, qual é a distribuição de 
tempo em que a lanterna pode operar? 

6.11 Suponha que X, X,, X,, X, e X, sejam 
variáveis aleatórias independentes contí- 
nuas com mesma função distribuição F e 
mesma função densidade f, e considere 


I=PX,<A,<X,<X<X] 


(a) Mostre que 7 não depende de F. 
Dica: Escreva 1 como uma integral 
com cinco dimensões e faça a mudan- 
ça de variáveis u, = F(x)),i = 1,...,5. 

(b) Avalie 7. 

(c) Forneça uma explicação intuitiva para 
a sua resposta da letra (b). 

6.12 Mostre que as variáveis aleatórias contí- 
nuas (discretas) contínuas X,...., X, são in- 
dependentes se e somente se a sua função 
densidade (discreta) de probabilidade con- 
junta f(x,....,x,) puder ser escrita como 


Fx. .,Xn) = Tg 


i=1 


para funções não negativas g(x),i = 1,...,n. 

6.13 No Exemplo 5c, calculamos a densidade 
condicional de uma probabilidade de su- 
cesso para uma sequência de tentativas 
quando as primeiras n + m tentativas 
resultaram em n sucessos. A densidade 
condicional mudaria se especificássemos 
quais dessas n tentativas resultaram em 
sucessos? 

6.14 Suponha que X e Y sejam variáveis alea- 
tórias geométricas com o mesmo parâme- 
tro p. 
(a) Sem qualquer cálculos, qual é para 

você o valor de 


PX=|X+Y=nh? 


Dica: Imagine que você joga conti- 
nuamente uma moeda com probabili- 
dade p de dar cara. Se a segunda cara 
ocorrer na n-ésima jogada, qual é a 
função de probabilidade do tempo da 
primeira cara? 

(b) Verifique sua conjectura da letra (a). 
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6.15 


6.16 


6.17 


Considere uma sequência de tentativas 
independentes, cada uma delas com pro- 
babilidade de sucesso p. Dado que o k- 
ésimo sucesso ocorre na tentativa n, mos- 
tre que todos os resultados possíveis das 
primeiras n — 1 tentativas que consistem 
em k — 1 sucessos e n — k fracassos são 
igualmente prováveis. 

Se Xe Ysão variáveis aleatórias bino- 
miais independentes com parâmetros 
ne p idênticos, mostre analiticamen- 
te que a distribuição condicional de X 
dado que X + Y = m é hipergeométri- 
ca. Além disso, forneça um segundo ar- 
gumento que leve ao mesmo resultado 
sem nenhum cálculo. 

Dica: Suponha que 2n moedas sejam jo- 
gadas. Represente com X o número de ca- 
ras obtidas nas primeiras n jogadas, e com 
Y o número de caras obtidas na segunda 
sequência de n jogadas. Mostre que, dado 
um total de m caras, o número de caras 
nas primeiras n jogadas tem a mesma dis- 
tribuição que o número de bolas brancas 
selecionadas quando uma amostra de ta- 
manho m é sorteada de n bolas brancas e 
n bolas pretas. 

Suponha que X, i = 1,2,3 sejam variáveis 
aleatórias independentes com distribui- 
ção de Poisson. Determine a sua função 
de probabilidade conjunta. Isto é, obte- 
nha P(X =n,Y=m). 


6.18 Suponha que Xe Y sejam variáveis alea- 


6.19 


tórias com valores inteiros. Se 


plilj) = P(X = |Y = j) 


e 
a0l) = PY =X = à) 
Mostre que 
; 1. Pé) 
PX=,Y=D)= = Pp 
Li gi 


Sejam X,, X, e X, variáveis aleatórias 
contínuas independentes e identicamente 
distribuídas. Calcule 

(a) PLX, > XX, > X5) 

(b) PIX, > XIX, < X5) 

(c) PIX, > XIX, > X) 

(d) PL, > XX, < X5) 


6.20 


6.21 


6.22 


6.23 


Suponha que U represente uma variável 
aleatória uniformemente distribuída no 
intervalo (0, 1). Calcule a distribuição 
condicional de U dado que 
(a) U>a. 
(b) U<a. 
Suponha que W, a umidade do ar em cer- 
to dia, seja uma variável aleatória gama 
com parâmetros (t, B). Isto é, sua densi- 
dade é f(w) = Be “(gw TO), w > 0. 
Suponha também que, dado que W = w,o 
número de acidentes nesse dia — chame-o 
de N — tem uma distribuição de Poisson 
com média w. Mostre que a distribuição 
condicional de W dado N = n é gama 
com parâmetros (t + n,B + 1). 
Seja W uma variável aleatória gama com 
parâmetros (ft, 8), e suponha que, tendo 
como condição W = w, X,, X,,..., X, se- 
jam variáveis aleatórias exponenciais in- 
dependentes com taxa w. Mostre que a 
distribuição condicional de W dado que 
X =x,Ã, =X. X, =x, É gama com 
parâmetros [t + n,8 + E) 
i=1 
Diz-se que um arranjo retangular de mn 
números organizado em n linhas e m co- 
lunas contém um ponto de sela se houver 
um número que é ao mesmo tempo o 
mínimo de sua linha e o máximo de sua 
coluna. Por exemplo, no arranjo 


E 
0 —2 6 
0,5 12 3 


o número 1 na primeira linha e na pri- 
meira coluna é um ponto de sela. A exis- 
tência de um ponto de sela é importante 
na teoria dos jogos. Considere um arranjo 
retangular de números conforme descri- 
to acima e suponha que dois indivíduos 
—- A e B - estejam jogando o seguinte 
jogo: À deve escolher um número inteiro 
de 1an,e B um número inteiro de 1 a 
m. Suas escolhas são anunciadas simul- 
taneamente. Se A escolhe i e B escolhe 
j, então A ganha de B a quantia especi- 
ficada pelo elemento contido na i-ésima 
linha e na j-ésima coluna do arranjo. Su- 
ponha agora que o arranjo contenha um 
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ponto de sela — digamos que na linha r e 
na coluna k — e chame esse ponto de x,,. 
Se o jogador 4 escolhe a linha r, então 
ele garante para si uma vitória de pelo 
menos x,, (já que x,, é o menor número 
na linha 1). Por outro lado, se o jogador 
B escolhe a coluna k, ele garante que não 
perderá mais de x,, (já que x,, é o maior 
número na coluna k). Portanto, como A 
tem uma estratégia que sempre lhe ga- 
rante um ganho mínimo de x,,, e B tem 
uma estratégia que sempre lhe garante 
uma perda máxima de x,,, parece razoá- 
vel escolher essas duas estratégias como 
sendo ótimas e declarar que o valor do 
jogo para o jogador 4 é x,,. 

Se os nm números no arranjo retan- 
gular descrito acima são escolhidos inde- 
pendentemente de uma distribuição con- 
tínua arbitrária, qual é a probabilidade 
de que o arranjo resultante contenha um 
ponto de sela? 

6.24 Se Xé exponencial com taxa À, determine 
P(L] = n,X- [X] = x), onde [x] é defini- 
do como o maior inteiro menor ou igual a 
x. Pode-se concluir que [X] e X — [X] são 
independentes? 

6.25 Suponha que F(x) seja uma função distri- 

buição cumulativa. Mostre que (a) F'(x) 
e(b)1-[1- F(x)]” também são funções 
distribuição cumulativas quando n é um 
inteiro positivo. 
Dica: Suponha que X,,..., X, sejam variá- 
veis aleatórias independentes com mes- 
ma função distribuição F. Defina variá- 
veis aleatórias Y e Z em termos de X, de 
modoque PY =x)-F()eP|Z=x|]= 
1-[1-P6). 

6.26 Mostre que, se n pessoas estão distribuí- 
das aleatoriamente ao longo de uma es- 
trada com extensão de L km, então a pro- 
babilidade de que 2 delas estejam a uma 
distância menor que D uma da outra é, 
quando D = L/(n-1),de[1-(n-DD/L]. 
EseD > L/((n-1)? 

6.27 Obtenha a Equação (6.2) calculando a 
derivada da Equação (6.4). 

6.28 Mostre que a mediana de uma amostra 
de tamanho 2n + 1 de uma distribuição 
uniforme ao longo do intervalo (0, 1) tem 


distribuição beta com parâmetros (n + 1, 
n+1). 

6.29 Verifique a Equação (6.6), que fornece a 
densidade conjunta de X,, e Xp 

6.30 Calcule a densidade do alcance de uma 
amostra de tamanho n de uma distribui- 
ção contínua com função densidade f. 

6.31 Sejam Xy, = No, S... = X, OS valores 
ordenados de n variáveis aleatórias inde- 
pendentes no intervalo (0, 1). Demonstre 
que, paral=sk=n+1, 


PXao— Hu nv> =D" 


onde Ay =0,X,n=! 

6.32 Suponha que X,,..., X, formem um con- 
junto de variáveis aleatórias contínuas 
independentes e identicamente distri- 
buídas com função distribuição F,e que 
Xp i = 1,...,n represente os seus valores 
ordenados. Se X, independentemente de 
Xi = 1,..,n, também tem distribuição 
F, determine 
(a) PIX > Km); 

(b) PIX > Xe): 
() PAX A<Aablsi<jsn. 

6.33 Suponha que X,,..., X, sejam variáveis 
aleatórias independentes e identicamen- 
te distribuídas com função distribuição 
Fe densidade f. A grandeza M = [X,, + 
Kwl'2, definida como a média do menor 
e do maior valorem X,,..., X,, é chamada 
de alcance central da sequência. Mostre 
que sua função distribuição é 


Futm)=n / “[FCm — 9 — FOFO dx 


6.34 Sejam X,,..., X, variáveis aleatórias in- 
dependentes e uniformes em (0, 1). Faça 
com que R = X,,— X represente o al- 
cance e M = [X t+ Xa]/2 represente o 
alcance central de X,,..., X,. Calcule a fun- 
ção densidade conjunta de Re M. 

6.35 Se Xe Y são variáveis aleatórias normais 
padrão independentes, determine a fun- 
ção densidade conjunta de 


U=X V=XY 


Depois use o seu resultado para mostrar 
que X/Y tem uma distribuição de Cauchy. 
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PROBLEMAS DE AUTOTESTE E EXERCÍCIOS 


6.1 Cada jogada de um dado viciado resulta 


em cada um dos números ímpares 1,3 e 5 
com probabilidade C, e em cada um dos 
números pares com probabilidade 2€. 

(a) Determine C€. 

(b) Suponha que o dado seja jogado. Supo- 
nha que X = 1 se o resultado for um 
número par e X = 0 caso contrário. 
Além disso, suponha que Y = 1 se o re- 
sultado for um número maior ou igual 
a3e Y = O caso contrário. Determine a 
função de probabilidade conjunta de X 
e Y. Suponha agora que 12 jogadas in- 
dependentes sejam feitas com o dado. 

(c) Determine a probabilidade de que 
cada um dos 6 resultados ocorra exa- 
tamente duas vezes. 

(d) Determine a probabilidade de que qua- 
tro dos resultados sejam 1 ou 2, quatro 
sejam 3 ou 4, e quatro sejam 5 ou 6. 

(e) Determine a probabilidade de que 
pelo menos 8 jogadas resultem em 
números pares. 


6.2 A função de probabilidade conjunta das 


variáveis aleatórias X, Y e Z é 
1 


p(1,2,3) = p(2,1,1) = p(2,2,1) = p(2,3,2) = Z 


Calcule (a) E[XYZ] e (b) E[XY + XZ 
+ YZ] 


6.3 A densidade conjunta de X e Y é dada por 
fox y)=Cy-xe” —-y<x<y, O<y<o 


(a) São X e Y independentes? 

(b) Determine a função densidade de X. 

(c) Determine a função densidade de Y. 

(d) Determine a função distribuição con- 
junta. 

(e) Determine E[Y]. 

(f) Determine P(X + Y<1). 


6.4 Seja r = 1, +... + r,, onde todos os r, são 


inteiros positivos. Mostre que, se X,,..., X, 
tem distribuição multinomial, então Y,...., 
Y, também a tem, onde, com r; = 0, 
n=1+ri 
Yi= a Xi, i<k 
j=nia+ 
Isto é, Y, é a soma do primeiro r, dos 


X's, Y, é a soma do r, seguinte, e assim 
por diante. 


6.5 Suponha que X, Y e Z sejam variáveis 


aleatórias independentes que têm a 
mesma probabilidade de serem iguais a 
1 ou 2. Determine a função de probabi- 
lidade de (a) XYZ,(b) XY + XZ + YZ, 
e()X + YZ. 


6.6 Sejam X e Y variáveis aleatórias contí- 


nuas com função densidade conjunta 


caso contrário 


A ER O<x<l,l<y<s 


onde c é uma constante. 

(a) Qual é o valor de c? 

(b) Xe Y são independentes? 
(c) Determine P(X + Y>3) 


6.7 A função densidade conjunta de Xe Y é 


xy 0O<x<1l,0<y<2 

fo, y) = fo caso contrário 
(a) Xe Y são independentes? 
(b) Determine a função densidade de X. 
(c) Determine a função densidade de Y. 
(d) Determine a função distribuição con- 

junta. 
(e) Determine E[Y]. 
(f) Determine P[X + Y <1]. 


6.8 Considere dois componentes e três tipos de 


choques. Um choque do tipo 1 causa uma 
falha no componente 1, um choque do tipo 
2 causa uma falha no componente 2, e o 
choque do tipo 3 causa uma falha nos com- 
ponentes 1 e 2. Os instantes de ocorrência 
dos choques dos tipos 1,2 e 3 são variáveis 
aleatórias com respectivas taxas À,,A, € Às. 
Suponha que X, represente o instante em 
que ocorre a falha do componente i, i = 
1,2. Diz-se que as variáveis aleatórias X,, 
X, têm distribuição exponencial bivariada. 
Determine P(X, >s,X,> 8). 


6.9 Considere uma seção de classificados com 


m páginas, onde m é muito grande. Su- 
ponha que o número de classificados por 
página varie e que a única maneira de des- 
cobrir quantos classificados há por página 
seja contá-los. Além disso, suponha que o 
número de páginas seja tão grande que a 
contagem do número de classificados seja 
inviável, e que seu objetivo seja escolher 
uma seção de classificados de forma tal 
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que cada um dos classificados tenha a 
mesma probabilidade de ser selecionado. 
(a) Se você escolhe aleatoriamente uma 
página e então escolhe aleatoriamente 
um classificado, isso satisfaria ao seu 
objetivo? Por que sim ou por que não? 
Suponha que n(i) represente o 
número de classificados na página i, 
i = 1,...,m, e que, embora essa quan- 
tidade seja desconhecida, ela seja me- 
nor que algum valor especificado n. 
Considere o seguinte algoritmo para 
escolher um classificado. 


Passo 1: Escolha aleatoriamente uma pági- 
na. Suponha que ela seja a página 
X. Determine n(X) contando o nú- 
mero de classificados na página X. 
Passo2: “Aceite” a página X com proba- 
bilidade n(X)/n. Se a página X 
for aceita, siga para o passo 3. Do 
contrário, retorne ao passo 1. 


Passo 3: Escolha aleatoriamente um dos 


classificados na página X. 


Chame cada passagem do algoritmo 
pelo passo 1 de iteração. Por exemplo, 
se a primeira página aleatoriamente 
escolhida for rejeitada e a segunda 
aceita, então teremos necessitado de 
2 iterações do algoritmo para obter 
um classificado. 

(b) Qual é a probabilidade de que uma 
única iteração do algoritmo resulte 
na aceitação de um classificado na 
página i? 

(c) Qual é a probabilidade de que uma 
única iteração do algoritmo resulte na 
aceitação de um classificado? 

(d) Qual é a probabilidade de que o algo- 
ritmo siga por k iterações, aceitando- 
se o j-ésimo classificado na página ina 
iteração final? 

(e) Qual é a probabilidade de que o j-ési- 
mo classificado na página i seja aquele 
obtido pelo algoritmo? 

(f) Qual é o número esperado de itera- 
ções feitas pelo algoritmo? 


6.10 As partes “aleatórias” do algoritmo no 


Problema de Autoteste 6.9 podem ser es- 
critas em termos dos valores gerados por 
uma sequência de variáveis aleatórias in- 
dependentes e uniformes no intervalo (0, 


1). Com [x] definido como o maior inteiro 
menor ou igual a x,o primeiro passo pode 
ser escrito da maneira a seguir: 


Passo 1: Gere uma variável aleatória U 


uniforme no intervalo (0, 1). Faça 
X = [mU] + 1 e determine o va- 
lor de m(X). 
(a) Explique por que o passo acima é 
equivalente ao passo 1 do Problema 
de Autoteste 6.9. 
Dica: Qual é a função de probabilida- 
de de X? 
(b) Escreva os passos restantes do algo- 
ritmo de maneira similar. 


6.11 Seja X,, X,,... uma sequência de variáveis 


aleatórias independentes e uniformes no 
intervalo (0,1). Para uma constante fixa c, 
defina a variável aleatória N por 


N=min[n:X, >c] 


N é independente de X,? Isto é, saber o 
valor da primeira variável aleatória maior 
ou igual a c afeta a distribuição de proba- 
bilidade do instante de ocorrência dessa 
variável aleatória? De uma explicação 
intuitiva para a sua resposta. 


6.12 O alvo de um jogo de dardos é um qua- 


drado tendo lados com tamanho 6. 


Os três círculos estão centrados no cen- 
tro do alvo e têm raios 1,2 e 3, respec- 
tivamente. Dardos que acertam o círculo 
de raio 1 marcam 30 pontos, dardos que 
acertam a região entre os círculos de raio 
1 e 2 marcam 20 pontos, e aqueles que 
acertam a região entre os círculos de raio 
2 e 3 marcam 10 pontos. Dardos que não 
acertam o interior do círculo de raio 3 não 
marcam pontos. Supondo que cada dardo 
que você atire atinja, independentemen- 
te do que tiver ocorrido antes, um ponto 
uniformemente distribuído no quadrado, 
determine as probabilidades dos eventos 
abaixo: 
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(a) Você marca 20 pontos em uma única 
jogada. 

(b) Você marca pelo menos 20 pontos em 
uma única jogada. 

(c) Você marca O pontos em uma única 
jogada. 

(d) O valor esperado de sua pontuação 
em uma jogada. 

(e) Você marca pelo menos 10 pontos em 
suas duas primeiras jogadas. 

(f) Sua pontuação total após duas joga- 
das é de 30 pontos. 

6.13 Um modelo proposto para os torneios 
de basquete da NBA supõe que, quando 
dois times com aproximadamente a mes- 
ma campanha jogam entre si, o número de 
pontos marcados em um quarto pelo time 
da casa menos o número de pontos marca- 
dos pelo time visitante é aproximadamente 
uma variável aleatória normal com média 
1,5 e variância 6. Além disso, o modelo su- 
põe que as diferenças de pontos ao longo 
dos quatro quartos sejam independentes. 
Suponha que esse modelo esteja correto. 
(a) Qual é a probabilidade de vitória do 

time da casa? 

(b) Qual é a probabilidade condicional de 
que o time da casa vença, dado que, 
no intervalo do meio do jogo, ele este- 
ja 5 pontos atrás? E 

(c) Qual é a probabilidade condicional de 
que o time da casa vença, dado que, 
no final do primeiro quarto, ele esteja 
5 pontos à frente? 

6.14 Seja N uma variável aleatória geométrica 
com parâmetro p. Suponha que a distri- 
buição condicional de X dado que N = n 
seja gama com parâmetros n e À. Deter- 
mine a função de probabilidade condicio- 
nal de N dado que X = x. 

6.15 Sejam Xe Y variáveis aleatórias indepen- 
dentes e uniformes no intervalo (0, 1). 
(a) Determine a densidade conjunta de 

U=X,V=X+7Y. 

(b) Use o resultado obtido na letra (a) 
para calcular a função densidade de V. 

6.16 Você e outras três pessoas fazem lances 
para adquirir um objeto em um leilão, sen- 
do o maior lance o vitorioso. Se ganhar, 
você planeja vender o objeto imediata- 
mente por 10 mil reais. De quanto deve 
ser o seu lance para que seu lucro máximo 


seja maximizado se você crê que os lances 
das demais pessoas possam ser considera- 
dos independentes e uniformemente dis- 
tribuídos entre 7 e 11 mil dólares? 
6.17 Determine a probabilidade de que X,, 
X,,..., X, seja uma permutação de 1,2.,...,n, 
quando X,, X,,..., X, são independentes e 
(a) cada um tem a mesma probabilidade 
de assumir qualquer um dos valores 
1,...,n. 

(b) cada um tem função de probabilidade 
PX,=j)=ppj=1.n. 

6.18 Sejam X,,..., X,e Y,...., Y, vetores aleató- 
rios independentes, com cada vetor sendo 
uma ordenação aleatória de k uns en — k 
zeros. Isto é, suas funções de probabilida- 
de conjuntas são 

PME is X=in)=PWiS ip Yh= in) 


1 n 


Faça com que 


n 
N=5 IX — Yil 


i=l 


represente o número de coordenadas nas 
quais os dois vetores têm valores diferen- 
tes. Além disso, suponha que M represen- 
te o número de valores de i para os quais 
X,=1,Y,=0. 
(a) Relacione Na M. 
(b) Qual é a distribuição de M? 
(c) Determine E[N]. 
(d) Determine Var(N). 

*6.19 Suponha que Z,, Z,...., Z, sejam variáveis 
aleatórias normais padrão independentes, 
e que 


(a) Qual é a distribuição condicional de 
S, dado que S, = y para k = 1,...,n? 

(b) Mostre que, para 1 = k = n,a distri- 
buição condicional de S, dado que S, 
= x é normal com média xk/n e va- 
riância k(n — k)/n. 

6.20 Seja X,, X,.... uma sequência de variáveis 
aleatórias normais independentes e iden- 
ticamente distribuídas. Determine 
(a) PIX,> XIX, = máx(X,...., X9)] 

(b) PIX, > XX, = máx(X,,..., X5)] 
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7.1 INTRODUÇÃO 


Neste capítulo, desenvolvemos e exploramos propriedades adicionais dos valo- 
res esperados. Para começar, lembre que o valor esperado da variável aleatória 
X é definido por 


E[X] = > xp() 


quando X é uma variável aleatória discreta com função de probabilidade p(x), 
e por 


EX] = o xf(x) dx 


quando X é uma variável aleatória contínua com função densidade de proba- 
bilidade f(x). 

Como E[X] é uma média ponderada dos possíveis valores de X, tem-se que, 
se X está entre a e b, então o mesmo ocorre com o seu valor esperado. Isto é, se 


PlasX=bj=1 
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então 
a<= EX] <b 


Para verificar essa afirmação, suponha que X seja uma variável aleatória discre- 
ta para a qual P(a = X = b] = 1. Como isso implica p(x) = O para todo x fora do 
intervalo [a, b], tem-se que 


EX]= 3º xp() 


x:p(x)>0 


= » ap(x) 


x:p(x)>0 


=a a p(x) 


x:p(x)>0 
=a 


Da mesma maneira, pode-se mostrar que E[X] = b, como no caso das variáveis 
aleatórias discretas. Como a demonstração no caso contínuo é similar, tem-se o 
resultado esperado. 


7.2 ESPERANÇA DE SOMAS DE VARIÁVEIS ALEATÓRIAS 


Para um caso bidimensional análogo às Proposições 4.1 do Capítulo 4 e 2.1 do 
Capítulo 5, que fornecem as fórmulas de cálculo do valor esperado de uma fun- 
ção de uma única variável aleatória, suponha que X e Y sejam variáveis aleató- 
rias, e g seja uma função de duas variáveis. Então temos o seguinte resultado. 


Proposição 2.1 Se Xe Y têm função de probabilidade conjunta p(x, y), então 
El, Y] = > > 8, y)p(,») 


y X 


Se Xe Y têm função densidade de probabilidade conjunta f(x, y), então 
[9,0] o 
Elg(X,Y] = / / gx, y)f(x,y) dx dy 
—00 J —00 


Vamos demonstrar a Proposição 2.1 quando as variáveis aleatórias X e Y 
são conjuntamente contínuas com função densidade conjunta f(x,y) e quando 
g(X, Y) é uma variável aleatória não negativa. Como g(X, Y) = 0, temos, pelo 
Lema 2.1 do Capítulo 5, 


Elg(X,YW] = [rem Y > dt 


Escrevendo 


PI&,Y) > = / K f(x,9) dy dx 
Cy)ig(x,y)>t 
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mostramos que 


Elg(X,Y)] =] 1 f(x,y) dy dx dt 
0 Cyiglry)>t 


Trocando a ordem de integração, obtemos 


800,7) 
ego = | [ [ Fledidjdo 
x Jy Jt=0 
- | [emnfa» dy dx 
Xxdy 


Assim, prova-se o resultado quando g(X, Y) é uma variável aleatória não ne- 
gativa. O caso geral é obtido como no caso unidimensional (veja os Exercícios 
Teóricos 5.2 e 5.3). 


Exemplo 2a 

Um acidente ocorre em um ponto X uniformemente distribuído ao longo de 
uma estrada com extensão L. No momento do acidente, uma ambulância está 
no ponto Y, que também é uniformemente distribuído ao longo da estrada. 
Supondo que X e Y sejam independentes, determine a distância esperada entre 
a ambulância e o local do acidente. 


Solução Precisamos calcular E[|X — Y!|]. Como a função densidade conjunta 
deXeYé 
1 
fQn=,7 0O<x<L 0<y<L 


resulta da Proposição 2.1 que 


1 LopeçL 
ex = Y0=55[ | e ldvas 


Agora, 
L x L 
[e -oiy= [e nar+ [o na 
0 0 x 
2 2 2 
x L x 
— L 
5) + 2 2 x( x) 
2 
= EE +22 —xL 
2 
Portanto, 
Rs Usa 
E(IX — Y]=— as Ecs 
[| |] z |, Ra s) dx 
L 


3 n 
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Para uma importante aplicação da Proposição 2.1, suponha que E[X] e 
E[Y] sejam ambos finitos e faça g(X, Y) = X + Y. Então, no caso contínuo, 


EX + Y]= [of + ronda 


-[ [senda + fr [fer áxay 


a afeta + [o yfyr 0) dy 
= EIX] + E[] 


Esse resultado também é válido no caso geral; assim, sempre que E[X] e E[Y] 
forem finitos, 


ELX + Y] = E[X] + E[Y] (2.1) 
Exemplo 2b 


Suponha que, para variáveis aleatórias X e Y, 
X=>Y 


Isto é, para qualquer resultado do experimento probabilístico, o valor da variá- 
vel aleatória X é sempre maior ou igual ao valor da variável aleatória Y. Como 
x = y é equivalente à desigualdade X — Y = 0, tem-se que E[X - Y] > 0,ou, 
equivalentemente, 

EX] = EU] n 
Usando a Equação (2.1), podemos mostrar por indução que, se E[X] é fini- 

to para todo i = 1,...,n, então 
E[X, +... + X,)) = ELX)] +... + E[X,) (2.2) 


A Equação (2.2) é uma fórmula extremamente útil cuja aplicação é ilustrada a 
seguir em uma série de exemplos. 


Exemplo 2c A média amostral 


Sejam X,,..., X, variáveis aleatórias independentes e identicamente distribuídas 
com função distribuição F e valor esperado q. Diz-se que tal sequência de va- 
riáveis aleatórias constitui uma amostra da distribuição F. A grandeza 


z-2 É 
i=1 


é chamada de média amostral. Calcule E[X]. 
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Solução 


1 n 
i= 


1 n 
=> E(X] 
n4 
i=1 
=u jáque E[X;] = u 


Isto é, o valor esperado de uma média amostral é u, a média da distribuição. 
Quando a média da distribuição é desconhecida, a média amostral é frequente- 
mente utilizada para estimá-la na disciplina de estatística. E 


Exemplo 2d Desigualdade de Boole 


Suponha que A,,..., 4, representem eventos, e defina as variáveis indicadoras 
X, 1,...,n, como 


Es 1 se A,ocorrer 
. O caso contrário 


Se 
n 
= 5 
i=1 


então X representa o número de eventos 4, ocorridos. Finalmente, suponha 


lo sex > 1 
VYV= E 
O caso contrário 


então Y é igual a 1 se pelo menos um dos eventos 4, ocorrer e é igual a O caso 
contrário. E agora imediato ver que 


X>Y 
então 


EX] = E[Y] 


Mas como 


El] => ElXi=> P(A) 
i=1 i=1 
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n 


E[Y] = Pípelo menos um dos eventos 4, ocorra) = P JA; 
i=1 


obtemos a desigualdade de Boole, isto é, 


n n 
PIUA|=s> PA) 
i=1 i=1 [-] 


Os próximos três exemplos mostram como a Equação (2.2) pode ser usada 
para calcular o valor esperado de variáveis aleatórias binomiais, binomiais ne- 
gativas e hipergeométricas. Essas deduções devem ser comparadas com aque- 
las apresentadas no Capítulo 4. 


Exemplo 2e Esperança de uma variável aleatória binomial 


Seja X uma variável aleatória binomial com parâmetros n e p. Lembrando que 
tal variável aleatória representa o número de sucessos em n tentativas indepen- 
dentes quando cada tentativa tem probabilidade de sucesso p, temos que 


X=M+AA, +.+X, 
onde 


É ses 1 seai-ésima tentativa é um sucesso 
' 10 seai-ésima tentativa é um fracasso 


Portanto, X, é uma variável aleatória de Bernoulli com esperança E[X,] = 1(p) 
+ O(1 — p). Assim, 


ELX] = ELX)) + ElX,)] +... + E[X,)] = np B 


Exemplo 2f Média de uma variável aleatória binomial negativa 


Se tentativas independentes com probabilidade de sucesso p constante são rea- 
lizadas, determine o número esperado de tentativas necessárias para que se 
acumule um total de r sucessos. 


Solução Se X representa o número de tentativas necessárias para que um 
total de r sucessos seja acumulado, então X é uma variável aleatória binomial 
negativa que pode ser representada por 


X=XAM+.+X, 


onde X, é o número de tentativas necessárias para que se obtenha o primeiro 
sucesso, X, é o número de tentativas adicionais até que o segundo sucesso seja 
obtido, X, é o número de tentativas adicionais até o terceiro sucesso seja obti- 
do, e assim por diante. Isto é, X, representa o número de tentativas adicionais 
necessárias após o (i — 1)-ésimo sucesso até que um total de i sucessos seja 
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acumulado. Pensando um pouco, percebemos que cada uma das variáveis alea- 
tórias X, é uma variável aleatória geométrica com parâmetro p. Com isso, dos 
resultados do Exemplo 8b do Capítulo 4, E(X,] = 1/p,i = 1,2,...,r; assim 


E(X] = ElX;] + --- + E[X,] = E 


Exemplo 2g Média de uma variável aleatória hipergeométrica 
Se n bolas são sorteadas de uma urna contendo N bolas das quais m são bran- 
cas, determine o número esperado de bolas brancas sorteadas. 


Solução Suponha que X represente o número de bolas brancas sorteadas, e 
represente X como 


X=X +.+X, 


onde 
Xx= 1 sea i-ésima bola branca é sorteada 
"10 caso contrário 
Agora, 
E[X)] = PlX; = 1) 
= Pfi-ésima bola branca é sorteda) 
1 N-1 
1 n-—1 
= N 
n 
on 
“N 
Portanto, 


E[X] = ED] + + Elm] =" 


Também poderíamos ter obtido o resultado anterior usando a representação 
alternativa 


X=Y+.+Y, 


onde 


Yo 1 seai-ésima bola sorteada é branca 
5 O caso contrário 


Como a i-ésima bola sorteada pode ser qualquer uma das N bolas, tem-se que 
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então 


EL) = Ei) ++ Erd= 


Exemplo 2h Número esperado de pareamentos 


Suponha que N pessoas joguem os seus chapéus no centro de uma sala. Os 
chapéus são misturados e cada pessoa seleciona um deles aleatoriamente. De- 
termine o número esperado de pessoas que selecionam o próprio chapéu. 


Solução Fazendo com que X represente o número de pareamentos, podemos 
calcular E[X] muito facilmente escrevendo 


X=NM+X+..+X, 
onde 


x= 1 'seai-ésima pessoa selecionar o seu próprio chapéu 
' 40 caso contrário 


Como, para cada i, a i-ésima pessoa tem a mesma probabilidade de selecionar 
qualquer um dos N chapéus, 


Ep]=PlG=D=5 


Assim, 


Com isso, em média, exatamente uma pessoa seleciona o seu próprio chapéu. EE 


Exemplo 2i Problemas de recolhimento de cupons 


Suponha que existam N diferentes tipos de cupons de desconto, e que cada vez 
que alguém recolha um cupom este tenha a mesma probabilidade de ser de 
qualquer um dos N tipos. Determine o número esperado de cupons que alguém 
precisa acumular antes de conseguir um conjunto completo que contenha pelo 
menos um de cada tipo. 


Solução Suponha que X represente o número de cupons acumulados antes 
que um conjunto completo seja acumulado. Calculamos E[X] usando a mesma 
técnica que usamos no cálculo da média de uma variável aleatória negativa bi- 
nomial (Exemplo 2f). Isto é, definimos X,, i = 0,1,..., N — 1 como sendo o núme- 
ro de cupons adicionais necessários para que se obtenha, após o recolhimento 
de i tipos distintos de cupons, um cupom diferente. Além disso, observamos 
que 


X=EM+HX ++X,, 
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Quando i tipos distintos de cupons já tiverem sido recolhidos, um novo cupom 
terá probabilidade (N — i)/N de ser de um tipo distinto. Portanto, 


ER = 
piúeme? (x) k=1 


N N 


ou, em outras palavras, X, é uma variável aleatória geométrica com parâmetro 


(N= DN. 
Assim, 
N 
EX] = —— 
Did= 1 — 
o que implica que 
N N 
EX|=1+4 TS as e 
EN dedo que 
= N-1 N = 


Exemplo 2j 

Dez caçadores estão esperando uma revoada de patos. Quando aparece um 
bando de patos, os caçadores atiram simultaneamente, mas cada um deles es- 
colhe o seu alvo aleatoriamente, independentemente dos demais. Se cada caça- 
dor atinge o seu alvo de maneira independente com probabilidade p, calcule o 
número esperado de patos que escapam ilesos quando um bando com 10 deles 
passa voando na frente dos caçadores. 


Solução Suponha que X, = 1 se o i-ésimo pato escapar ileso e X, = O caso 
contrário, para i = 1,2,..., 10. O número esperado de patos que escapam ilesos 
pode ser escrito como 


EIX, +... + X] = ELX)] +... + EIXO 


Para calcular E[X,] = P(X, = 1), notamos que cada um dos caçadores irá, de 
forma independente, acertar o i-ésimo pato com probabilidade p/10. Então, 


10 
ce js 
P(X;=1)= (1 5) 


Portanto, 


E[X] = 10 (1 E B) 


Exemplo 2k Número esperado de séries 

Suponha que uma sequência de n 1's e m 0ºs seja permutada aleatoriamente de 
forma que cada um dos (n + m)!(n!m!) arranjos possíveis seja igualmente pro- 
vável. Qualquer sequência consecutiva de 1's é chamada de série de 1's — por 
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exemplo, se n = 6,m = 4,e a sequência é 1,1,1,0,1,1,0,0,1,0, então há 3 séries 
de 1ºs — e estamos interessados em calcular o número médio de tais séries. Para 
calcular essa grandeza, considere 


ces 1 se uma série de 1's começar na i-ésima posição 
"10 caso contrário 


Portanto, R(1), o número de séries de 1's, pode ser escrita como 


n+m 


RD = 5. I; 
fl 


e daí resulta que 


n+m 


EIR(D] = >. Eli] 
i=1 


Agora, 
ELA] = P(“1” na posição 1) 
n 


n+m 
eparal<i<n+m, 


El[L;] = P(“0” na posição i - 1,“1” na posição i) 
o m n 
“ntmntm-l 


Portanto, 
nm 
(n+mn+m-— 1) 


ER] = "a + (tm) 


Similarmente, E[R(0)], o número esperado de séries de 0's, é 
m nm 


E UU gre er 


e o número esperado de séries de qualquer tipo é 


2nm 


ER) + ROJ=1+ E 


Exemplo 21 Caminhada aleatória em um plano 


Considere uma partícula localizada inicialmente em um ponto dado no plano, 
e suponha que ela siga uma sequência de passos de tamanho fixo, mas em dire- 
ção completamente aleatória. Especificamente, suponha que, após cada passo, 
a nova posição esteja a uma unidade de distância da posição anterior, em um 
ângulo de orientação uniformemente distribuído ao longo de (0, 27) (veja a 
Figura 71). Calcule o valor esperado do quadrado da distância em relação à 
origem após n passos. 
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(0) = posição inicial 


(D = posição após o primeiro passo 


O) = posição após o segundo passo 


Figura 7.1 


Solução Se (X,, Y,) representa, em coordenadas retangulares, a mudança de 


L 


posição no i-ésimo passo, com i = 1....,n, temos 

X, = cos 6, 

Y,= sen 6, 
onde 6, i = 1,...,n, é, por hipótese, uma variável aleatória independente uni- 
forme no intervalo (0, 27). Como a posição após n passos tem coordenadas 


n n 
retangulares | >: Xi, , Y; | tem-se como consequência que D”, o quadrado da 
i=1 i=1 
distância a partir da origem, é dado por 
2 2 


n n 
D? = 2X + > Y; 
i=1 d=1 


5X +YD +53 XX; + YiY) 


i=1 ij 


=n + Je > (cos 6; cos0; + sen O; sen 6) 
ij 


onde cos”9, + sen?9, = 1. Calculando as esperanças, usando a independência de 
0, e 6; quando i < j e também o fato de que 


27 
2x E(cos 6,] - | cosudu =sen2r — sen0=0 
0 


2x 
27x E[sen 6;] 2) senudu =cos0 — cos2x = 0 
0 
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chegamos em 


EID]|=n a 


Exemplo 2m Analisando o algoritmo de ordenação rápida 


Suponha que nos deparemos com um conjunto de n valores distintos x,, x,,..., 
x, & que queiramos colocar esses valores em ordem crescente, ou, como se diz 
comumente, ordená-los. Um procedimento eficiente para realizar essa tarefa é 
o algoritmo de ordenação rápida, que é definido da seguinte maneira. Quando 
n = 2,0 algoritmo compara os dois valores e coloca-os na ordem apropriada. 
Quando n > 2, um dos elementos é escolhido aleatoriamente — digamos que 
seja o elemento x, — e então os demais valores são comparados com x,. Aqueles 
que são menores que x, são colocados em uma chave à sua esquerda, e aqueles 
que são maiores são colocados em uma chave à sua direita. O algoritmo então 
se repete no interior das chaves e continua até que todos os valores tenham 
sido ordenados. Por exemplo, suponha que queiramos ordenar os 10 algarismos 
distintos a seguir: 


5,9,3,10,11,14,8,4,176 


Começamos escolhendo aleatoriamente um dos valores do conjunto (cada va- 
lor tem probabilidade de 1/10 de ser escolhido). Suponha, por exemplo, que o 
valor 10 seja escolhido. Comparamos então cada um dos demais valores com 
este valor, colocando em uma chave à esquerda todos aqueles que forem me- 
nores que 10 e, em uma chave à direita, todos aqueles que forem maiores que 
10. Isso resulta em 


(5,9,3,8,4,6),10, (11,14,17) 


Agora selecionamos um conjunto que contenha mais de um elemento — diga- 
mos, aquele à esquerda de 10 — e escolhemos aleatoriamente um de seus ele- 
mentos — por exemplo, o 6. Comparando cada um dos valores na chave com o 
6 e colocando os menores em uma nova chave à sua esquerda e os maiores em 
uma nova chave à sua direita, obtemos 


(5,3,4],6, [9,8], 10, (11,14,17) 


Se agora considerarmos a chave mais à esquerda e escolhermos aleatoriamente 
o valor 4 para comparação, então a próxima iteração resulta em 


(3),4, (5],6, [9,8], 10, (11,14,17) 


O processo continua até que cada uma das chaves contenha no máximo um 
único elemento. 

Se X representa o número de comparações necessárias para que o algorit- 
mo de ordenação rápida ordene n números distintos, então E[X] é uma medi- 
da da eficiência desse algoritmo. Para calcularmos E[X], vamos primeiramente 
escrever X como uma soma de outras variáveis aleatórias da maneira a seguir. 
Para começar, chame de 1 o menor valor a ser ordenado, de 2 o segundo menor 
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valor a ser ordenado, e assim por diante. Então, para 1 = i <j = n, suponha 
que I(i, ;) seja igual a 1 se ie j forem comparados diretamente, e igual a O caso 
contrário. Com essa definição, obtém-se 


nl n 
K= o» o 
i=1 j=im 
o que implica que 


n—1 


E[X]=E sz Ii,)) 


i=1 j=i+ 


n-1 n 


> >, ElGD) 


= 


Hi 


j=iH 


1 
n-1 n 


H 


P(i cj sejam comparados alguma vez) 
i=1 j=it 


Para determinar a probabilidade de que i e j sejam comparados alguma vez, 
note que os valores i,i + 1,...,) — 1,j estarão inicialmente na mesma chave 
e ali permanecerão se o número escolhido para a primeira comparação não 
estiver entre i e j. Por exemplo, se o número de comparação for maior que j, 
então todos os valores i,i + 1,...,j — 1,j irão para uma chave à esquerda do 
número de comparação; se este for menor do que i, então todos os valores 
vão para uma chave à direita do número de comparação. Assim, todos os va- 
lores i,i + 1,...,] — 1,j permanecerão na mesma chave até que um deles seja 
escolhido como o número de comparação. Neste momento, todos os demais 
valores entre i e | serão comparados com esse valor. Se, no entanto, esse va- 
lor de comparação não for nem i nem j, a comparação destes valores com o 
valor de comparação resulta na ida de i para a chave da esquerda e de j para 
a chave da direita. Com isso, i e j estarão em chaves diferentes e nunca serão 
comparados. Por outro lado, se o valor de comparação do conjunto i,i + 1...., 
j-1,j for i ou j, então ocorrerá uma comparação direta entre i e j. Agora, dado 
que o valor de comparação é um dos valores entre i e j, tem-se que esse valor 
tem a mesma probabilidade de ser qualquer um desses j — i + 1 valores. Com 
isso, a probabilidade do valor de comparação ser i ou j é iguala 2/(j-i + 1). 
Portanto, podemos concluir que 


2 


Pliej sejam comparados alguma vez) = ——— 
j-i+1 


Es DD e 


i=1 j=i41 
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Para obtermos uma aproximação para o valor de E[X] quando n é grande, po- 
demos representar as somas como integrais. Então, 
n 


2 [. 2 
a RT Ra — o dx 
Ferro dba di mx-i+l 
= 2log(x — i + Dl 
= 2log(n — i + 1) — 2ZlogQ) 
= 2log(n — i + 1) 
Logo, 


n—1 


E[X] = > 2log(n — i + 1) 
i=1 


n-1 
=2 [ log(n — x + 1) dx 
1 


= NR log(y)dy 
2 


= Uylog() — W)l 
= 2nlog(n) 


Assim, vemos que, quando n é grande, o algoritmo de ordenação rápida requer, 


em média, aproximadamente 2n log(n) comparações para ordenar n valores 
distintos. E 


Exemplo 2n A probabilidade da união de eventos 


Suponha que A,,... A, representem eventos, e defina as variáveis indicadoras X,, 
i =1,...,n, como 


x= 1 se A;ocorrer 
"10 caso contrário 


Agora, observe que 


n 
vo. Jl se U A;ocorrer 
É — Ha — 4)= E caso contrário 
i=. 


E ' = Ha Ea ») =P (04) 


Portanto, 
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Expandindo o lado esquerdo da fórmula anterior, obtemos 


(Ou = E Dx —- 35X; + 5,5), )., XXX 


i<j i<j<k 


= ess vao coptas 
(2.3) 
Entretanto, 


ho se A; Ai --- Ai, Ocorrer 


O caso contrário 


então 
E[X;, + Xi) == P(A, > -Ai) 


Assim, a Equação (2.3) é somente uma afirmação da conhecida fórmula para a 
união de eventos: 


P(UA) = P(A) — DIS P(AAD + DDD PIAA;AR) 
i i<j ixj<k 
= ate P(A ÃO E 


Quando se lida com coleções infinitas de variáveis aleatórias X, i = 1, cada uma 
com esperança finita, não é necessariamente verdade que 


oo [0,0] 
E|3 x:|=> EX 
i=1 i=1 (2.4) 
[8,0] 
Para determinar quando a Equação (2.4) é valida, observamos que 3, X; = 
n j= 
lim 5 X;. Assim, ; 


—300 - 
n 9 ;-1 


[0,0) n 
E Da] e RA 
i= i= 


n 
Ta 
gap o 


i=1 


n 
= fui 2. ElXi) 
i=1 
09 


i=1 (2.5) 
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Portanto, a Equação (2.4) é válida sempre que pudermos justificar a mudança 
na ordem das operações de esperança e limite na Equação (2.5). Embora, em 
geral, essa mudança não seja justificada, pode-se mostrar que ela é válida em 
dois casos importantes: 


1. Os X;s são variáveis aleatórias não negativas. (Isto é, P(X, = 0) = 1 para 
todo 1.) 


> SE Rlixi< 06. 
i=l 


Exemplo 20 


Considere qualquer variável aleatória não negativa inteira X. Se, para cada 
i > 1, definirmos 


1 seXzi 
E seX <i 


então 


[e x [2 
3X=),K+ 5 % 
= 


i=l i=X+1 

X [0,0 
esp 5.0 

i=1 i=X+1 
=X 


Portanto, como os X/s são todos não negativos, obtemos 


E[X] = > EX) 
i=1 


=5 PX =i) 
i=1 (2.6) 


que é uma identidade útil. E 


Exemplo 2p 


Suponha que n elementos — chame-os de 1,2,...,n — devam ser armazenados em 
um computador na forma de uma lista ordenada. Em cada unidade de tempo, 
um desses elementos é requisitado [a probabilidade do elemento i ser escolhido 


é, independentemente do passado, P(i), i = 1,5) P(i) = 1]. Supondo que essas 
i 
probabilidades sejam conhecidas, que ordenação minimiza a posição média do 


elemento selecionado na lista? 


Solução Suponha que os elementos sejam numerados de forma que P(1) = 
PQ) =... > P(n). Para mostrar que 1,2....,n é a ordenação ótima, faça com que 
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X represente a posição do elemento requisitado. Agora, para qualquer ordena- 
ção — digamos, O = i,, bi, 


PolX ==> P(j 
j=k 


n 
=5 P() 

j=k 
=P." A =h) 


Somando em k e usando a Equação (2.6), obtemos 


EM] = Esp. n1Ã] 


o que mostra que a ordenação dos elementos em ordem decrescente de pro- 
babilidade de que eles sejam requisitados minimiza a posição esperada do ele- 
mento requisitado. 1] 


*7.2.1 Obtendo limites de esperanças por meio 
do método probabilístico 


O método probabilístico é uma técnica para a análise das propriedades dos ele- 
mentos de um conjunto que introduz probabilidades neste conjunto e estuda 
um elemento escolhido de acordo com essas probabilidades. Essa técnica foi 
vista anteriormente no Exemplo 41 do Capítulo 3, onde foi usada para mostrar 
que um conjunto continha um elemento que satisfazia certa propriedade. Nesta 
subseção, mostramos como ela pode ser às vezes utilizada para limitar funções 
complicadas. 

Seja f uma função dos elementos de um conjunto finito S e suponha que 
estejamos interessados em 

m mr (s) 

Um limite inferior para m pode ser muitas vezes obtido fazendo-se com que $ 
seja um elemento aleatório do conjunto S para o qual o valor esperado de HS) 
pode ser calculado, e então observando-se que m = f(S) implica que 


m = ElHS)] 


com estrita desigualdade se f(S) não é uma variável aleatória constante. Isto é, 
ElHS)] é um limite inferior para o valor máximo. 


Exemplo 2q O número máximo de caminhos Hamiltonianos 


em um torneio 
n 


Considere um torneio com n > 2 competidores no qual cada um dos (2) pares 
de competidores joga entre si exatamente uma vez. Suponha que os jogadores 
sejam numerados com 1, 2,3,...,n. A permutação i,, i,,...,i, é chamada de cami- 
nho Hamiltoniano se i, ganhar de i, i, ganhar de i,,...,e i, , ganhar de i,. Um 
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problema de algum interesse é a determinação do maior número possível de 
caminhos Hamiltonianos. 

Como uma ilustração, suponha o caso de 3 jogadores. Por um lado, se um 
deles vence duas vezes, então existe um único caminho Hamiltoniano (por 
exemplo, se 1 vence duas vezes, e 2 ganha de 3, então o único caminho Hamilto- 
niano é 1,2,3). Por outro lado, se cada um dos jogadores vence uma vez, então 
há 3 caminhos Hamiltonianos (por exemplo, se 1 ganha de 2,2 ganha de 3, e 
3 ganha de 1, então 1,2,3;2,3,1;e 3,1,2 são todos Hamiltonianos). Portanto, 
quando n = 3, há no máximo 3 caminhos Hamiltonianos. 

Agora mostramos que existe um resultado do torneio que resulta em mais 
que n!/27 caminhos Hamiltonianos. Para começar, suponha que o resultado 


do torneio especifique o resultado de cada um dos (5) jogos jogados, e que S 
n 


| do gar 
represente o conjunto de todos os 2 1/ possíveis resultados do torneio. Então, 
com f(s) definido como o número de caminhos Hamiltonianos obtidos quando 
o resultado é s E S, nos é solicitado mostrar que 


e n! 
máx f(s) = 3 
Para isso, considere o resultado S aleatoriamente escolhido quando os resul- 

n). o ; 
tados dos 2 ) Jogos são independentes, com cada competidor tendo a mesma 


probabilidade de vencer cada confronto. Para determinar E[f(S)], o número 
esperado de caminhos Hamiltonianos obtidos com o resultado $, numere as n! 
permutações e, para i = 1,...,n!, faça 


E 1, sea permutação i for Hamiltoniana 
'" 10, caso contrário 


Já que 


fN=)2,X 


tem-se que 


ES] = > EX] 


Como, pela hipótese de independência dos resultados dos jogos, a probabilida- 
de de que qualquer permutação especificada seja Hamiltoniana é de (1/2), 
tem-se que 


EIX] = P(X, = 1) = (129) 
Portanto, 


ElKS)] = n!(1U9 
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Como f(S) não é uma variável aleatória constante, a equação anterior implica a 
em Ê < da E - Y 

existência de um resultado do torneio com que possui mais de n!/2” caminhos 

Hamiltonianos. ” 


Exemplo 2r 


Um bosque com 52 árvores é arranjado de maneira circular. Se 15 esquilos vi- 
vem nessas árvores, mostre que existe um grupo de 7 árvores consecutivas que 
abrigam juntas pelo menos 3 esquilos. 


Solução Considere a vizinhança de uma árvore como sendo aquela árvore 
mais as seis árvores encontradas quando se move na direção horária. Quere- 
mos mostrar que, para qualquer escolha de acomodação dos 15 esquilos, existe 
uma árvore que tem pelo menos 3 esquilos vivendo em sua vizinhança. Para 
mostrar isso, escolha aleatoriamente uma árvore e faça com que X represente 
o número de esquilos que vivem em sua vizinhança. Para determinar E[X], nu- 
mere arbitrariamente os 15 esquilos e, para i = 1,..., 15, considere 


X= 1, seo esquilo i viver na vizinhança da árvore escolhida aleatoriamente 
!'" 10, caso contrário 


15 
X= o X; 
i=1 
obtemos 
15 
ElX] = 5 EIX] 
i=1 


Entretanto, como X, será igual a 1 se a árvore escolhida aleatoriamente for 
qualquer uma das 7 árvores que incluem aquela em que vive o esquilo i mais as 
6 árvores vizinhas, 


7 
EX]=PG=D=5 


Consequentemente, 


cuj= >2 


mostrando que existe uma árvore com mais de 2 esquilos vivendo em sua 
vizinhança. E 


*7,2.2 A identidade dos máximos e mínimos 


Começamos com uma identidade que relaciona o máximo de um conjunto de 
números ao mínimo dos subconjuntos desses números. 
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Proposição 2.22 Para números arbitrários x, 1,...,n, 
máxx; = De — > mínçr, x) + bp mín(X;,X;,Xk) 
: i i<j i<j<k 


E cc dt DE iminias, is) 


Demonstração Vamos fornecer uma demonstração probabilística para 
a proposição. Para começar, suponha que todos os x, estejam no interva- 
lo [0, 1]. Suponha que U seja uma variável aleatória uniforme em (0,1), e 
defina os eventos A,i = 1,...,n,como 4,= [U <x,. Isto é, 4, é o evento 
em que a variável aleatória uniforme é menor que x,. Como pelo menos 
um dos eventos 4, ocorrerá se U for menor do que pelo menos um dos 
valores de x,, temos que 


U;A; = |u < mé 
4 
Portanto 
P(U;A;)) = eu < máx = máxXx; 
i i 


Também, 
P(A)=P(U<x)=x, 


Além disso, como todos os eventos A;,,..., A; ocorrerão se U for menor 
que os valores x;,,..., xi, Vemos que a interseção desses eventos é 


Ai... A; =14U< mina, 
ê j=l,.r : 


implicando que 


Assim, a proposição resulta da fórmula de inclusão-exclusão para a proba- 
bilidade da união de eventos: 


P(U;A;) =D P(A) — > PAGA) + Do PAA;AO 
i i<j i<j<k 


ros e PÇA ÃO) 


Quando x, for não negativo, mas não restrito ao intervalo unitário, 
suponha que c seja tal que todo x, seja menor que c. Então a identidade 
continua válida para os valores y; = x/c e o resultado desejado é obtido 
multiplicando-se tudo por c. Quando x, pode ser negativo, suponha que 
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b seja tal que x, + b > O para todo i. Portanto, pelo desenvolvimento 


anterior, 
máx(x; + b) = + b) — > mín; + bx; + b) 
1 z E 
i i<j 
do (Line by cad ED) 
Fazendo : 
M=55; — So míncai, xy) +. + (=P mín(x,,...,Xn) 
i 


i<j 


podemos reescrever a identidade anterior como 


máxx; + b=M +o(p — É ines, cs cora (1) 


0=01-1)"=1-n+ (6) + cr(T) 


A equação anterior mostra que 


Mas 


máxx;=M 
1 


e a proposição está demonstrada. O 


Resulta da Proposição 2.2. que, para quaisquer variáveis aleatórias X,...., X,, 
máx X; = Dx - Do mín(Xi,X) psd (Din, co) 
i i<j 


O cálculo da esperança de ambos os lados dessa igualdade resulta na seguinte 
relação entre o valor esperado do máximo e aqueles dos mínimos parciais: 


E [més Ed = 5 EX] — > ElmíncX;, Xp) 
i i<j 


+ + CDHEmMINO,...,X)] (2.7) 


Exemplo 2s Recolhimento de cupons com probabilidades desiguais 


Suponha que existam n tipos diferentes de cupons de desconto e que cada vez 

que alguém recolha um cupom este seja, independentemente dos cupons já 
n 

coletados, um cupom do tipo i com probabilidade p, >) p; = 1. Determine o 
i=1 

número esperado de cupons que alguém precisa recolher até completar um 

conjunto completo com pelo menos um cupom de cada tipo. 
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Solução Se X, representa o número de cupons que alguém precisa recolher 
para obter um cupom do tipo i, então podemos escrever X como 
X= máx X; 
TEL a 

Como cada novo cupom obtido é do tipo i com probabilidade p,, X, é uma variável 
aleatória geométrica com parâmetro p,. Também, como o mínimo de X, e X,é o 
número de cupons necessários para se obter um cupom do tipo i ou do tipo j, tem- 
se que, para i  j, mín(X,, X,) é uma variável aleatória geométrica com parâmetro 
P; + Pp; Similarmente, mín(X, X, X,), o número de cupons necessários para se ob- 
ter um cupom do tipo i,j ou k é uma variável aleatória geométrica com parâmetro 
p;t p; + py e assim por diante. Portanto, a identidade (2.7) resulta em 


DD + SD == 


à iu Pit Pj + Pk 
1 
++ (Dt! 
o a ga ce 
Observando que 
oo 

/ -P dx = Es 

0 p 


e usando a identidade 


n 
1 — Ho — ePS = Dee — > en +. + (IPtle- Pit tpndx 
4 


i<j 


mostramos, integrando a identidade, que 
fo6] n 
EX] = ) 1-[[d cer) ax 
0 E 
i=1 


é uma forma computacional mais útil. E 


7.3 MOMENTOS DO NÚMERO DE EVENTOS OCORRIDOS 


Muitos dos exemplos resolvidos na seção anterior eram da seguinte forma: 
para dados eventos 4,...., 4,, determine E[X], onde X é o número de eventos 
ocorridos. A solução envolvia então a definição de uma variável indicadora I, 
para o evento À, de forma que 


pis 1, se A,ocorrer 
“10, caso contrário 


Como 


n 
X = 36 
i=1 
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obtivemos o resultado 


ERES El= SS Bi= > PA) 
Ei Ei i=1 (3.1) 


Suponha agora que estejamos interessados no número de pares de even- 
tos ocorridos. Como 1, será igual a 1 se 4,e A, ocorrerem, e O caso contrário, 
tem-se que o número de pares é igual a ):;..; 1:l;. Mas como X é o número de 
eventos ocorridos, tem-se também que o número de pares de eventos ocorridos 


é (E ) Consequentemente, 
XxX 
E ) => dh 
i<j 
onde há (5) termos na soma. Calculando as esperanças, obtemos 
X 
E lê ) => EllJ=>, PAi) 
i<j i<j (3.2) 
ou 
X(X — 1) 
E E = DL P(AA)) 
i<j 
resultando em 


ED2] — EIX]=25 PA;A) 
i<j (3.3) 


o que resulta em E[X'], e assim Var(X) = E[X”] - (E[X)). 
Além disso, considerando o número de subconjuntos distintos com k even- 
tos ocorridos, vemos que 


X 
(1) = 05. Ih 
4 <iz<..<ik 
O cálculo da esperança fornece a identidade 


e()|- DO Eahhl= O PAAAy) 


iy<i<..<ik ij<iz<..<ik (3.4) 


Exemplo 3a Momentos de variáveis aleatórias binomiais 


Considere n tentativas independentes, cada uma com probabilidade de sucesso 
P, Seja A, o evento em que a tentativa i é um sucesso. Quando i <j, P(A A) = 
p”. Consequentemente, a Equação (3.2) resulta em 


(O-ze=( 


i<j 
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ou 
EXO(X — Dl=n(n — Dp? 

ou 
EL) — EX] = nn — dp? 

Como agora E[X] = 57, P(A;) = np, temos, da equação anterior, que 


Var(X) = EIXO] - (E[X]P = n(n = 1)p" + np (np = np(1 — p) 


o que concorda com o resultado obtido na Seção 4.6.1. 
Em geral, como P(A; Ai, - -- Aj,) = p*, obtemos da Equação (3.4) que 


IG-,E4-(r 


h<i<...<ik 
ou, equivalentemente, 
ELX(X =D... (X-k+ D])=n(n-1)...(n-k + Dp* 


Os valores sucessivos E[X'*], k = 3, podem ser obtidos recursivamente a partir 
dessa identidade. Por exemplo, com k = 3, obtém-se 


EMX(X —- DX — D=n(n- Dn — DP 


EPÊ —- 3X? + 2X] =n(n — Den — Dp? 
ou 
Epé] = 3E[X?] — 2E[X] + n(n — Din — Dpº 
=3n(n — Dpº + np + n(n — Dn — Dpº E 


Exemplo 3b Momentos de variáveis aleatórias hipergeométricas 


Suponha que n bolas sejam sorteadas de uma urna contendo N bolas, das quais 

m são brancas. Seja 4, o evento em que a i-ésima bola sorteada é branca. Então 

X, o número de bolas brancas sorteadas, é igual à quantidade de eventos 4,,..., 

A, ocorridos. Como a i-ésima bola sorteada tem a mesma probabilidade de ser 

qualquer uma das N bolas, das quais m são brancas, P(A;) = m/N. Consequente- 

mente, a Equação (3.1) resulta em E[X] = 51, P(A;) = nm/N. Também, como 
mm -—1 


P(A;A;) = P(ADP(A;IA;) = NNDI 


obtemos, da Equação (3.2), que 


Mo mim — Do (nm(m-— 1) 
el) LN Do Elm — 1) 


i<j 
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ou 
m(m — 1) 


mostrando que 


Fo pc RT pai, 


NN = 1) + EX] 


Essa fórmula fornece a variância da distribuição hipergeométrica, isto é, 


Var(X) = ELX?] — (EX)? 


o 1 mim — 1) Es nm nim? 
Ru DN = CN N2 
comnl(n — Dm -— 1) mn 

=" N-1 Ei | 


o que concorda com o resultado obtido no Exemplo 8j do Capítulo 4. 
Momentos de ordem superior de X são obtidos usando-se a Equação (3.4). 
Como 
mm — D(m-k+ 1) 


HAsAo A) SNDDON-K+D 


A Equação (3.4) resulta em 
E E] (pa A? 
kJ | AKINN - Do a(N-k+1) 


EX De =] 


ou 


mim — Dm >— k+ 1) 
N(N - De(N-k+D E 


=n(n>— D-(n-—- k+ 1) 


Exemplo 3c Momentos no problema do pareamento 


Para i = 1,..., N, seja 4,0 evento em que a pessoa i seleciona o seu próprio cha- 
péu no problema do pareamento. Então, 


1 1 
P(A;A;) = P(A) PCA;IAS) = NNDT 


o que resulta porque, condicionando-se no evento em que a pessoa i seleciona 
o seu próprio chapéu, o chapéu selecionado pela pessoa j tem a mesma proba- 
bilidade de ser qualquer um dos demais N — 1 chapéus, dos quais um é o seu. 
Conseguentemente, com X igual ao número de pessoas que selecionam o seu 
próprio chapéu, resulta da Equação (3.2) que 
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o que mostra que 
E(X-D]=1 
Portanto, E[X”] = 1 + E[X]. Como E[X] = 5º, P(A;) = 1, obtemos 
Var(X) = EX] - (E[X]? = 1 


Assim, tanto a média quanto a variância do número de pareamentos são iguais 
a 1. Para momentos de ordem mais elevada, usamos a Equação (3.4), juntamen- 
te com o fato de que P(A; A; --- A) = para obter 


1 
NNDAN=ED? 


(| o (1) E DR =kK+D 


EX(X-D.(X-k+D]=1 E 


ou 


Exemplo 3d Mais um problema de recolhimento de cupons 


Suponha que existam N tipos diferentes de cupons de desconto e que, inde- 
pendentemente dos tipos já recolhidos, cada novo cupom recolhido tenha 
probabilidade p, de ser to tipo j, Ad 1P; = 1. Determine o valor esperado e 
a variância do número de diferentes tipos de cupons aparecendo entre os 


primeiros n cupons recolhidos. 


Solução Será mais conveniente trabalhar com o número de tipos de cupons 
não recolhidos. Assim, suponha que Y represente o número de diferentes tipos 
de cupons recolhidos, e que X = N — Y represente o número de tipos não reco- 
lhidos. Definindo 4, como o evento em que não há cupons do tipo i na coleção, 
X é igual à quantidade de eventos 4,,..., Ay ocorridos. Como os tipos de cupons 
sucessivos recolhidos são independentes, e, com probabilidade 1 — p, cada novo 
cupom não é do tipo i, temos 


P(A) =(1 =P) 
Assim, E[X] = E ad — pi)”, de onde resulta que 
N 


EI]=N = EMXJ=N- Sa pm? 
i=l 


Similarmente, como cada um dos n cupons coletados não é nem do tipo i, nem 
do tipo j, com probabilidade 1 — p;— p; temos 


P(AA) = fl =P; P)'i = 
Assim, 


EIX(X — Dl= 25 P(A; = 250 = pib 


i<j i<j 
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ou 
EX?]=25 4 — pi — py” + EX] 
i<j 
Logo, obtemos 
Var(Y) = Var(X) 
= EIXO?) — (EX? 


2 
N N 
=25d-p-pr+DAd-pr- [DA -p 
i<j i=1 i=1 


No caso especial em que p, = 1/N,i = 1,..., N,a fórmula anterior dá 


anenfi- (1-3) 


VaW =N(N —1 pi uai | efe 
mn =nn-D(=- 5) en a) -N(-) 


Exemplo 3e As variáveis aleatórias hipergeométricas negativas 


Suponha que uma urna contenha n + m bolas, das quais n são especiais e m são 
comuns. Essas bolas são retiradas uma de cada vez, e qualquer uma das bolas 
ainda na urna tem a mesma probabilidade de ser retirada. Diz-se que a variável 
aleatória Y, igual ao número de bolas que precisam ser retiradas até que se reti- 
rem r bolas especiais, tem distribuição hipergeométrica negativa. A distribuição 
hipergeométrica negativa tem com a distribuição hipergeométrica a mesma re- 
lação que a distribuição binomial negativa tem com a distribuição binomial. Isto 
é, em ambos os casos, em vez de considerar uma variável aleatória igual ao nú- 
mero de sucessos em um número fixo de tentativas (como é o caso das variáveis 
aleatórias binomial e hipergeométrica), tais distribuições consideram o número 
de tentativas necessárias para que se obtenha um número fixo de sucessos. 

Para obter a função de probabilidade de uma variável aleatória hipergeo- 
métrica X, note que X será igual a k se 


(a) as primeiras k — 1 bolas retiradas compreenderem » — 1 bolas especiais e 
k —r bolas ordinárias e 
(b) a k-ésima bola retirada for especial. 


Consequentemente, 


(Cole) n-r+1 


a E 


PX=k= 


382 Probabilidade: Um Curso Moderno com Aplicações 


Não utilizaremos, no entanto, a função de probabilidade anterior para obter a mé- 
dia e a variância de X. Em vez disso, vamos identificar as m bolas comuns como 
01,:-» O,» € depois, para cada i = 1,...,n, faremos com que A, seja o evento em que 
a bola o, é removida antes da retirada de r bolas especiais. Então, se X é o número 
dos eventos 4,,..., 4, ocorridos, tem-se que X fornece o número de bolas comuns 
retiradas antes da retirada de um total de r bolas especiais. Consequentemente, 


Y=r+X 


mostrando que 


ElY]=r + ElX]=r+ 5 P(A 
i=1 


Para determinar P(A,), considere as n + 1 bolas que compreendem um total 

de o, bolas comuns e n bolas especiais. Dessas n + 1 bolas, o, tem a mesma pro- 

babilidade de ser a primeira, a segunda ou qualquer bola retirada. Portanto, a 

probabilidade de que ela esteja entre as primeiras r bolas selecionadas (e então 

seja removida antes da retirada de r bolas especiais) é +. Consequentemente, 
r 


id n+1 


ro rmn+tmA 1) 
n+10 n+1 


ElY]=r+m 


Assim, por exemplo, o número esperado de cartas de um baralho bem-embara- 
lhado que precisam ser viradas até que apareça uma carta do naipe de espadas 
é1 + E = 3,186, 0 Almiro esperado de cartas que precisam ser viradas até 
que apareça um ás é 1 + 8 = 10,6. 

Para determinar Var(Y) = Var(X), usamos a identidade 


E[X(X — )]=25 P(A4;A) 


i<j 


Agora, P(A;A,) é a probabilidade de que as bolas o, e o, sejam removidas antes 
da retirada de um total de r bolas especiais. Portanto, considere as n + 2 bolas 
que compreendem as bolas o,, 0; e as n bolas especiais. Como as ordens de reti- 
rada dessas bolas são igualmente prováveis, a probabilidade de que as bolas o, 
e o; estejam entre as primeiras r + 1 bolas removidas (e também sejam removi- 
das antes da retirada de r bolas especiais) é 


O) mr+D 


P(A;A) = Eae SS E 
Eta Do M+Dn+2 
Consequentemente, 
om r(r + 1) 
ma DI DG ro 
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então 
rr + 29) 
EX ]=mm-D)———— — + EX 
Ee ( Va + Dan +D a] 
Como E[X] = m;-5, isso resulta em 
r(r + 1) r r E 
= V = — 
Var(Y) ar(X) = m(m — 1) E DIE Da E] (m, E 7) 
Com um pouco de álgebra, mostramos então que 
— 1 
Var(Y) = m(in+1i->-ny(n+mA+4D 
(n + Din + 2) E 


Exemplo 3f Eventos singulares no problema do recolhimento 
de cupons 


Suponha que existam n tipos distintos de cupons de desconto e que, indepen- 
dentemente dos tipos já recolhidos, cada novo cupom obtido tenha a mesma 
probabilidade de ser de qualquer tipo. Suponha também que alguém continue 
a recolher cupons até que um conjunto completo contendo pelo menos um 
cupom de cada tipo tenha sido obtido. Determine o valor esperado e a variân- 
cia do número de tipos dos quais apenas um cupom tenha sido recolhido. 


Solução Seja X igual ao número de tipos de cupons dos quais exatamente um 
cupom tenha sido recolhido. Também suponha que T, represente o i-ésimo tipo 
de cupom coletado e que 4, represente o evento em que há apenas um único 
cupom do tipo 7; no conjunto completo. Como X é igual ao número de eventos 
A,,..., À, ocorridos, temos 


E[X] = > P(A) 
i=1 


No momento em que o cupom do tipo 7; for recolhido pela primeira vez, ainda 
restarão n — i tipos de cupons a serem recolhidos até que um conjunto completo 
seja formado. Como, a partir daí, cada um desses n — i + 1 tipos de cupons (isto 
é, os n — i que ainda não foram recolhidos e o cupom do tipo T)) terá a mesma 
probabilidade de ser o último a ser recolhido, tem-se que o cupom do tipo T, 
será o último a ser recolhido (e portanto será singular) com probabilidade —.. 


n=i4+ 
Consequentemente, P(A,) = — O que resulta em 


a 1 1 
E IL, 


i=1 i=1 


Para determinar a variância do número de cupons únicos, ou singulares, suponha 
que S,,i <j,seja o evento em que o primeiro cupom do tipo 7, recolhido é o único 
daquele tipo a ter sido recolhido até o recolhimento do cupom do tipo T.. Então 


P(AA) = P(A AS, P(S,) 
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Agora, P(S,,) é a probabilidade de que, logo que o cupom do tipo 7; tenha sido 
recolhido, dos n — 1 + 1 tipos de cupons que compreendem o tipo Te osn-i 
tipos ainda não recolhidos, um cupom do tipo T, não esteja entre os primeiros 
J — i cupons desses tipos a serem recolhidos. Como um cupom do tipo T, tem a 
mesma probabilidade de ser o primeiro, o segundo, ou...,n — i + 1 desses tipos 
recolhidos, temos 


j=ioon+1-j 
n-i+1 n+1-i 


P(Sip=1-— 


Agora, condicionando no evento S, » tanto A,e A, ocorrem se, no momento em 
que o primeiro cupom do tipo 7 for recolhido, dos n — j + 2 cupons que com- 
preendem os tipos de cupons T, e T,e osn —j tipos de cupons ainda não recolhi- 
dos, T;e T, sejam recolhidos após os demais n — j cupons. Mas isso implica que 


1 1 
n-j+2n-j+4+1 


P(A;A;S;) =2 


Portanto, 


2 


Ia a du 
n+1-)n+2-) 


P(A;A;) = 


o que resulta em 


1 
deputac= Dl=4h% FR RE RE o 


Consequentemente, usando o resultado anterior para E[X], obtemos 


2 
1 = "1 
no Erros * 57 (E) ' 


i=1 


7.4 COVARIÂNCIA, VARIÂNCIA DE SOMAS E CORRELAÇÕES 


A proposição a seguir mostra que a esperança de um produto de variáveis alea- 
tórias independentes é igual ao produto de suas esperanças. 


Proposição 4.1 Se Xe Y são independentes, então, para quaisquer funções h 
eg, 


Elg00NO)] = Elg OO TEINO)] 


Demonstração Suponha que Xe Y sejam variáveis aleatórias conjunta- 
mente contínuas com função densidade conjunta f(x, y). Então, 


ElgQONY)] = / / gh, y) dx dy 
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= TA ENO) fx (fr (9) dx dy 


(0,0) oo 
= / hOfyO)dy / g0)fx (0) dx 
So o 
= E(h(Y) JElg(O] 
A demonstração para o caso discreto é similar. 0 


Assim como o valor esperado e a variância de uma única variável aleató- 
ria nos fornecem informações sobre essa variável aleatória, a covariância entre 
duas variáveis aleatórias nos fornece informações sobre a relação entre as va- 
riáveis aleatórias. 


Definição 


A covariância entre X e Y, representada como Cov(X, Y), é definida como 


Cov(X, Y) = EX — ELXD(Y - E[Y)) 


Expandindo o lado direito da definição anterior, vemos que 
Cov(X,Y) = E[XY — E[X])Y — XE[Y] + ElYJE(]] 
= E[XY] — E(X]E[Y] — ELXJE(Y] + ELTE(Y] 
= E[XY] — E(X]E[Y] 
Observe que, se X e Y são independentes, então, pela Proposição 4.1, 
Cov(X, Y) = 0. Entretanto, o inverso não é verdade. Um simples exame de duas 


variáveis aleatórias X e Y dependentes com covariância zero é obtido fazendo- 
se com que X seja uma variável aleatória tal que 


PW=0=PW==PX=-=5 


e definindo-se 


O sex 0 
a seX =0 


Agora, XY = 0, então E[XY] = 0. Também, E[X] = 0. Assim, 
Cov(X, Y) = ELXY] - ELIEIY] = 0 


Entretanto, X e Y são claramente dependentes. 
À proposição a seguir lista algumas propriedades da covariância. 
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Proposição 4.2 

(1) Cov(X, Y) = Cov(Y, X) 
(ii) Cov(X,X) = Var(X) 
(ui) Cov(aX,Y) = aCov(X, Y) 


n m n m 
(iv) Cov| 5 X,) Y|=5 3 Covcxi; yr) 
i=1 j=1 


i=1 j=l 


Demonstração da Proposição 4.2 As proposições (i) e (ii) resultam imediata- 
mente da definição da covariância, e a proposição (iii) é deixada como exercí- 
cio para o leitor. Para demonstrar a proposição (iv), que diz que a operação de 
cálculo da covariância é aditiva (como é a operação de cálculo do valor espera- 
do), suponha que uy, = E[X]]e v,= E[Y]. Então, 


n n m m 
e[Bx)-Bm eJEn]-Em 
i=1 i=1 j=1 j=1 


n m n n m m 
Cov|> X,) Y|=E (5x — Su Y;—-3w 
j=1 j=1 


i=1 = j=1 j=l 
=E (Xi; — ui) >; — Vi) 
i=1 j=1 
=E|S DX — uy — v) 
i=1 j= 
=> 5 EX — uY; — vp] 
i=1 j=1 


onde a última igualdade é obtida porque o valor esperado da soma de variáveis 
aleatórias é igual à soma de seus valores esperados. 0 


Resulta das propriedades (ii) e (iv) da Proposição 4.2, supondo-se que Y, = 


X, 1,...,n, que 


ij 


n n n 
Var [5x] = Cov 35X > 
i=1 i=1 j=1 
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= 3 o Cov(Xi, X;) 


ELEi 
n 

= 53 Var(X) + 353) Cov(X;,X) 
i=1 [ig 


Como cada par de índices i,j, i * j, aparece duas vezes no somatório duplo, a 
fórmula anterior é equivalente a 


n n 
Var[3)X;|=5 Var(X) + 25:53 CovX,X) 
i=l i=1 i<j 


(41) 


Se X,,..., X, são independentes por pares, no sentido de X, e X, serem inde- 
pendentes para i < y, então a Equação (4.1) reduz-se para 


n n 
Var >, Xi = 35 Var(x;) 


i=1 
Os exemplos seguintes ilustram o uso da Equação (4.1). 


Exemplo 4a 


Sejam X,,..., X, variáveis aleatórias independentes identicamente distribuí- 
das com valor esperado q e variância o”, e, como no Exemplo 2c, suponha que 
— hn X 2a: vo. - 
X = > Xi;/nseja a média amostral. As grandezas X; — X,i=1,...,n,são cha- 
i=1 
madas de desvios, e elas são iguais às diferenças entre os valores individuais dos 
dados e a média amostral. A variável aleatória 
n 72 
(Xi — X) 
S=) "+ 
a n-—1 
i=l 
é chamada de variância amostral. Determine (a) Var(X) e (b) E[S?]. 


Solução (a) 


IV 
= (5) > Var(x;) pela independência 
i=1 
go 
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(b) Começamos com a seguinte identidade algébrica: 
n 
(n- D$=5 0% -wn+u 
1=1 


=5M-n2+5X-uw?- 2X —- > O — q) 
i=1 i=1 i=1 

=) Xi 
i=1 


= 55X — wu? — nO — wu? 
i=1 


me + nX-u)-2ZX-unX- an) 


Calculando a esperança da equação anterior, obtemos 


n 
(n — DEIS] = 5 EX — 0] — nELX — w] 
i=1 
=no? — nVar(X) 
=(n-— Do? 
onde a igualdade final fez uso da letra (a) deste exemplo e a igualdade anterior 
fez uso do resultado do Exemplo 2c, isto é, E[X] = q. Dividindo ambos os lados 


por n — 1, mostramos que o valor esperado da variância amostral é a distribuição 
variância o”. E 


Nosso próximo exemplo apresenta um outro método para o cálculo da va- 
riância de uma variável aleatória binomial. 


Exemplo 4b Variância de uma variável aleatória binomial 
Calcule a variância de uma variável aleatória binomial X com parâmetros n e p. 


Solução Como tal variável aleatória representa o número de sucessos em n 
tentativas independentes quando cada tentativa tem a mesma probabilidade de 
sucesso p, podemos escrever 


X=X +.+X, 
onde X, representa variáveis independentes de Bernoulli tais que 


X- 1 seai-ésima tentativa é um sucesso 
!" 10 caso contrário 


Com isso, da Equação (4.1), obtemos 


Var(X) = Var(X,) +... + Var(X,) 
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Mas 
Var(Xi) = ELX?] — (ED)? 
= E[X;] — (EIX)? já que X? = X; 
=p — p 
Logo, 
Var(X) = np(1 —p) = 


Exemplo 4c Amostras de uma população finita 


Considere um conjunto de N pessoas. Cada uma delas tem uma opinião sobre 
certo assunto que é medida pelo número real v. Este representa o “nível de 
certeza” com a qual a pessoa pode opinar sobre o assunto. Suponha que v; re- 
presente o nível de certeza da pessoa i, com i = 1,...,N. 

Suponha também que as grandezas v, i = 1,..., N, sejam desconhecidas e 
que, para determiná-las, um grupo de n pessoas seja “escolhido aleatoriamente” 


do total de N pessoas, de forma que todos os : subconjuntos de tamanho n 


tenham a mesma probabilidade de serem escolhidos. Essas n pessoas são então 
questionadas e seus níveis de certeza determinados. Se S representa a soma dos 
n valores amostrados, determine sua média e variância. 

Uma importante aplicação desse problema consiste na realização de uma 
eleição na qual cada pessoa da população é favorável ou contrária a certo candi- 
dato ou proposta. Se consideramos v;= 1 se a pessoa i for favorável e v, = O se 
ela for contrária, então v = > v;/N representa a proporção da população que 
é favorável. Para se estimar v, Sscalhese uma amostra aleatória de n pessoas e 
faz-se uma pesquisa com essas pessoas. A proporção de pessoas entrevistadas 
que está a favor — isto é, S/n — é muitas vezes usada como uma estimativa de v. 


Solução Para cada pessoa i,i = 1,..., N, defina uma variável , que indique se a 
pessoa está incluída ou não na amostra. Isto é, 


L= 1 sea pessoa i está na amostra aleatória 
"(0 caso contrário 


Agora, S pode ser escrito como 


então 
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Var(S) = > Var(vil;) + 2 3 o Cov(vili, vjl;) 


i=1 i<j 
N 
= > víVardi) + 2535 vivjCovli, 1) 
i=1 i<j 
Como 
n 
Eli) = q 
nn — : 
Elll=4ND1 
tem-se que 
Var(I;) = q (1 — 7) 
n(n — 1) ny? 
CovistD= ir — (8) 
= —n(N — n) 
“NEN -1) 
Portanto, 


N je 
E[S]=n NE” 


i=1 


onfN-—-n E 2 2n(N — n) 
Var(S) = 5 ( je vi — NEN — 1) 22" 


A expressão para Var(S) pode ser simplificada com o uso da identidade (v, + 


+ vy) = 5) v? + 25) >) viv;. Após algumas manipulações, obtemos 


i=1 i<j N 
N E 
vartg)="DB(el 


Considere agora o caso especial em que Np dos v's são iguais a 1 e os restantes 
iguais a 0. Nesse caso, S é uma variável aleatória hipergeométrica com média e 
variância dadas, respectivamente, por 


E[S|=nv=np jáquev=—— =p 
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A grandeza S/n, que é igual à proporção de elementos amostrados que têm 
valores iguais a 1, é tal que 
A) 
Fl) 
n 
S N-n 
V = 1 
ar (1) No nº p) â 


A correlação das duas variáveis aleatórias X e Y, representada por p(X, Y), 


é definida, desde que Var(X) e Var(Y) sejam positivas, como 
Cov(X,Y) 


pls NV Var) Var(Y) 


-I=<(X,Y<1 


Para demonstrar a Equação (4.2), suponha que X e Y tenham variâncias dadas 


Pode-se mostrar que 
(4.2) 


poroZe a, respectivamente. Então, por um lado, 


0 = Var (E + x) 
o 


Ox 


=” Var(X) Var(Y) 2Cov(X,Y) 
o o2 0x0y 
=2[1+ 0(X,Y)] 
o que implica que 
-I<p(X,Y) 
Por outro lado, 
O = Var (x — A] 
ox 0y 
Var(X) VarY 2Cov(X,Y) 
o2 (-oy)? 0x0y 
=2[1 — 0(X,Y)] 
o que implica que 
(XY) <1 


o que completa a demonstração da Equação (4.2). 
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De fato, como Var(Z) implica Z constante com probabilidade 1 (essa 
relação intuitiva é demonstrada de forma rigorosa no Capítulo 8), resulta 
da demonstração da Equação (4.2) que p(X, Y) = 1 implica que Y = a + 
bX,onde b = 0/o,>0,e p(X, Y) = —1 implica que Y = a + DX, onde b = 
—o o, < 0. Deixamos como exercício para o leitor mostrar que o inverso 
também é verdade: quese Y = a + bX, então p(X, Y) é iguala +1 ou —1 
dependendo do sinal de b. 

O coeficiente de correlação é uma medida do grau de linearidade entre X e 
Y. Um valor de p(X, Y) próximo a +1 ou -1 indica um alto grau de linearidade 
entre X e Y, enquanto um valor próximo a O indica que tal linearidade é ausen- 
te. Um valor positivo de p(X, Y) indica que Y tende a crescer quando X cresce, 
enquanto um valor negativo indica que Y tende a decrescer quando X cresce. 
Se p(X, Y) = 0, diz-se que X e Y são não correlacionados. 


Exemplo 4d 
Sejam 1, e 7, variáveis indicadoras dos eventos 4 e B. Isto é, 


Eres 1 se A ocorrer 
4 10 caso contrário 


fu 1 se Bocorrer 
Bjo caso contrário 


Então 
E(IA] = P(A) 
EllB] = P(B) 
ElIalB] = P(AB) 
logo, 


Cov(a,IB) = P(AB) — P(AJP(B) 
= P(BJIP(AIB) — P(A)) 


Assim, obtemos um resultado bastante intuitivo. Ele diz que as variáveis indi- 
cadoras de A e B estão positivamente correlacionadas, não correlacionadas, ou 
negativamente correlacionadas se a probabilidade P(A|B) for maior que, igual 
a, ou menor que P(A), respectivamente. = 


Nosso próximo exemplo mostra que a média amostral e um desvio da mé- 
dia amostral são não correlacionados. 


Exemplo 4e 


Sejam X,,..., X, variáveis aleatórias independentes identicamente distribuídas 
Ei . 2 
com variância o”. Mostre que 


Cov(X; —- X,X)=0 
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Solução Temos 


Cov(X; — X,X) = Cov(X,,X) — Cov(X,X) 


1Ú = 
= Cov | Xi, - n2i — Var(X) 
J= 


Lo : 
= 3) Cov(X,X) — — 
no h 
j=1 
2 2 
Es 
n hH 


onde a penúltima igualdade usa o resultado do Exemplo 4a e a igualdade final 
é obtida porque 


0 sej * i pela independência 

Coviti do) = | 02 sej=i pois Var(X;) = o? 

Embora X e o desvio X, — X sejam não correlacionados, esses parâmetros não 
são, em geral, independentes. Entretanto, no caso especial em que as variáveis 
X, são variáveis aleatórias normais, X é independente de toda a sequência de 
desvios Ai e. j = 1,...,n. Esse resultado será estabelecido na Seção 78, onde 
mostraremos que, neste caso, a média amostral X e a variância amostral S são 
independentes. Mostraremos também que (n — 1)8?/o” tem distribuição qui- 
quadrado com n — 1 graus de liberdade (veja o Exemplo 4a para a definição 
de Sº). = 


Exemplo 4f 
Considere m tentativas independentes, cada uma levando a qualquer um dos » 
resultados possíveis com probabilidades P,, P,,...,P,, >. P; = 1. Se fizermos com 
que N, i = 1,...,r, represente a quantidade de iestatas que levam ao resultado 
i, então N,, N,,..., N, têm a distribuição multinomial 

ml! 


r 
PNi=mN=nm,..oN=n)=———+ I PS PR mm 
nitno!...n, = 


Para i * j, parece razoável que, com N, grande, N, tenda a ser pequeno; portanto, 


é intuitivo que essas variáveis estejam negativamente correlacionadas. Vamos 
calcular sua covariância usando a Proposição 4.2(iv) e as representações 


N= E ido e Np= > 10) 
k=1 k=1 
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onde 


LdjE 1 seatentativa k levar ao resultado i 
A 10 caso contrário 
se a tentativa K levar ao resultado j 
I; (k) = Ts 
O caso contrário 


Da Proposição 4.2(iv), temos 


m m 
Cov(Ni,N) => > Covíli(k), 1768) 

t=1k=1 

Agora, por um lado, quando k * £, 
Cov(li(k), 10) = 0 
pois o resultado da tentativa k é independente do resultado da tentativa £. Por 
outro lado, 
Cov(i(b), IK0) = EUCOIKO] — EUCOEU;O] 
=0— P;P;=-—P;P; 


onde a equação usa o fato de que 1;(£)1;(£) = 0, já que a tentativa £ não pode 
levar simultaneamente aos resultados i e j. Com isso, obtemos 


Cov(N,N) = -mPpP, 


o que está de acordo com nossa intuição de que N, e N, são negativamente 
correlacionados. n 


7.5 ESPERANÇA CONDICIONAL 


7.5.1 Definições 

Lembre que, se X e Y são variáveis aleatórias conjuntamente discretas, então a 
função de probabilidade condicional de X dado que Y = y é definida, para todo 
ytalque P[Y=y)>0,por 

PG,y) 

prO) 


É portanto natural definir, nesse caso, a esperança condicional de X dado que 
Y = y, para todos os valores de y tais que p;(y) > 0, como 


EMX|Y=y])=5> xPX =xY =) 


pxiyrGly) = PLX =x|Y = y) = 


=> xpxiy(xb) 
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Exemplo 5a 


Se Xe Ysão variáveis aleatórias binomiais independentes com parâmetros n e 
p idênticos, calcule o valor esperado condicional de X dado que X + Y =m. 


Solução Vamos primeiro calcular a função de probabilidade condicional de 
X dado que X + Y = m. Para k = mín(n,m), 


X=kX Y = 
P(X =k|X + sá CS de 


PX + Y=m) 
PX=kY=m-k) 
“CC PX+Y=m) 
“PX=WPWY=m-k) 
= PX+Y=m) 


” n a = 
(x) pra Ea pr” k la Há ) p” ni 6! paé py mk 
2n 2n- 
(5)pra - pre 
n n 
kJ im — k 
2n 
m 
onde usamos o fato (veja o Exemplo 3f do Capítulo 6) de que X + Y é uma 
variável aleatória binomial com parâmetros 2n e p. Com isso, a distribuição 


condicional de X dado que X + Y = m é hipergeométrica. Assim, do Exemplo 
2g, obtemos 


m 
E(XIX + Y=m|=— 
ix + Yy=m=5 E 
Similarmente, vamos relembrar que, se X e Y são conjuntamente contínuas 
com função densidade de probabilidade conjunta f(x, y), então a função densi- 
dade de probabilidade condicional de X dado que Y = y é definida, para todos 
os valores de y tais que f(y) > 0, por 


— TO) 
Fxjy Gy) = AO) 


É natural, nesse caso, definir a esperança condicional de X dado que Y = y, 
por 


etxIy =9]= [ xfxyy (x]y) dx 


desde que f(y) > 0. 
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Exemplo 5b 
Suponha que a densidade conjunta de X e Y seja dada por 
ee) 
Ph ide Da me <00; 0 = Poe do 


Calcule E[X|Y = 3]. 


Solução Começamos calculando a densidade condicional 


f(x,y) 
fr0) 
f(x,y) 


f o fc, y) dx 
“amesbes 

o / “AEDES dx 
(e 

o [ anvestras 


= Lx 


x 


Peyy (xy) = 


Com isso, a distribuição condicional de X, dado que Y = y, é uma distribuição 
exponencial com média y. Assim, 


oo 
EL I|Y =3] - | ED dr=y 
0) = 


Observação: Assim como as probabilidades condicionais satisfazem to- 
das as propriedades das probabilidades comuns, as esperanças condicionais sa- 
tisfazem as propriedades das esperanças comuns, Por exemplo, fórmulas como 

He g0)px|y (xy) no caso discreto 
ELgCOIY =y]= 4 oo 
1! g0)fxiy (xy) dx no caso contínuo 
—00 


E [Eur = | E > EmY =] 
i=l i=l 


permanecem válidas. Na realidade, a esperança condicional dado que Y = y 
pode ser pensada como sendo uma esperança comum em um espaço amostral 
reduzido formado apenas por resultados para os quais Y = y. = 
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7.5.2 Calculando esperanças usando condições 

Vamos representar como E[X|Y] a função da variável aleatória Y cujo valor 
em Y = y é E[X|Y = y]. Note que E[X|Y] é ela própria uma variável aleató- 
ria. Uma propriedade extremamente importante das esperanças condicionais é 
dada pela proposição a seguir. 


Proposição 5.1 
E(X] = ELE[XY]) (5.1) 
Se Y é uma variável aleatória discreta, então a Equação (5.1) diz que 
EX) => EMX|Y =P =9) (5.1a) 
y 


Por outro lado, se Y é contínua com densidade f,(y), a Equação (5.1) diz que 


EIX] = f. E(XIY = ylfr0) dy (5.1b) 


Damos agora uma demonstração da Equação (5.1) para o caso em que Xe Y 
são variáveis aleatórias discretas. 


Demonstração da Equação (5.1) quando X e Y são discretas: Devemos mos- 
trar que 


EX]= 5 EXIY=yPO =») (5.2) 
y 


Agora, o lado direito da Equação (5.2) pode ser escrito como 


SEX =yPY=90=) 5 xPX=F=9PW=)) - 
y yo x 
PX=x,Y=)y) 
= DCD OP = 
Di pr=9 =A 
=>) 4PX =2,Y =] 
y x 
ES A PS RES) 
x y 


= aPpr= 4] 


= E(X] 


e o resultado está demonstrado. 0] 


Uma maneira de entender a Equação (5.2) é interpretá-la da seguinte ma- 
neira. Para calcular E[X], podemos obter uma média ponderada do valor espe- 
rado condicional de X dado que Y = y, sendo cada um dos termos E[X|Y = 3] 
ponderado pela probabilidade do evento ao qual está condicionado (isso lembra 
você de alguma coisa?). Este é um resultado extremamente útil que muitas vezes 
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nos permite calcular esperanças com certa facilidade, simplesmente colocando 
algum tipo de condição em alguma variável aleatória apropriada. Os exemplos a 
seguir ilustram o seu uso. 


Exemplo 5c 


Um minerador está preso em uma mina contendo 3 portas. A primeira porta 
leva a um túnel que o levará à saída após 3 horas de viagem. A segunda porta 
leva a um túnel que fará com que ele retorne à mina após 5 horas de viagem. A 
terceira porta leva a um túnel que fará com que ele retorne à mina após 7 horas. 
Se considerarmos que o minerador pode escolher qualquer uma das portas com 
igual probabilidade, qual é o tempo esperado para que ele chegue à saída? 


Solução Suponha que X represente a quantidade de tempo (em horas) até 
que o minerador consiga sair e faça com que Y represente a porta que ele esco- 
lheu primeiro. Assim, 


EX] = EXIY=1]PW =1) + EXP =2]Ppy =2) 
+ ELX|Y =3]Pfy =3) 


= Leepyyy =1] + ELX|Y =2] + E[X|Y =3) 


3 
Entretanto, 
EX|Y=1)=3 
EX|Y =2]=5 + E[X] 
E(X|Y =3]=7 + EX] (5.3) 


Para entender por que a Equação (5.3) está correta, por exemplo, escolha E[X|Y 
= 2] e pense da seguinte maneira: se o minerador escolher a segunda porta, ele 
gastará 5 horas no túnel e então retornará ao ponto de partida. Mas assim que ti- 
ver retornado, o problema é o mesmo de antes; assim, o tempo adicional espera- 
do até que ele atinja a saída é somente E[X). Com isso, E[X|Y = 2] = 5 + E[X). 
O argumento por trás das igualdades na Equação (5.3) é similar. Portanto, 


ED] = 50 +5+ EX] +7+ EX) 


ou 


Exemplo 5d Esperança da soma de um número aleatório 
de variáveis aleatórias 


Suponha que o número de pessoas que entram em uma loja de departamentos 
em determinado dia seja uma variável aleatória com média 50. Suponha ainda 
que as quantias de dinheiro gastas por esses clientes sejam variáveis aleatórias 
independentes com média comum de R$80,00. Finalmente, suponha também 
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que a quantia gasta por um cliente seja independente do número total de clien- 
tes que entram na loja. Qual é a quantidade esperada de dinheiro gasto na loja 
em um dado dia? 


Solução Se N representa o número de clientes que entram na loja e X, a 
quantidade de dinheiro gasta pelo i-ésimo cliente, então a quantidade total de 


dinheiro gasta pode ser escrita como >) X;. Agora, 
i=1 


: pi RE [tm 
Mas 
E [Dm = ] =E [um = ] 


n 
=E B a] pela independência de X,e N 
1 


=nE[X] onde E[X] = E[X;] 


o que implica que 
N 
E [um = NE[X] 
1 
Assim, 
N 
E E a] = E(NE[X]] = E[NJE(X] 
i=1 


Com isso, em nosso exemplo, a quantidade esperada de dinheiro gasto na loja é 
de 50 x R$80,00, ou R$4.000,00. E 


Exemplo 5e 

Certo jogo começa com o rolar de um par de dados. Se a soma dos dados der 2, 
3 ou 12,0 jogador perde. Se der 7 ou 11,0 jogador vence. Se der qualquer outro 
número i, o jogador continua a rolar o dado até que a soma seja 7 ou i. Se for 7, 
o jogador perde; se for i, o jogador vence. Suponha que R represente o número 
de jogadas feitas. Determine 


(a) E(R]; 
(b) ElRijogador vence]; 
(c) ElRijogador perde]. 
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Solução Se P, representa a probabilidade de que a soma dos dados seja igual 
ai, então 
i— lo. 
Pi=Pi= 1= 2.005) 


Para calcular E[R], condicionamos em S, a soma inicial, e obtemos 


12 
E(R] = 3 ERIS = ilP; 
i=2 
Entretanto, 
E sei =2,3,7,11,12 
=il= 1 
ERIS = i] 1+ -———, caso contrário 
P;+ P; 


Obtém-se a equação anterior porque, se a soma é igual a um valor i que não fi- 
naliza o jogo, então os dados continuam a ser jogados até que a soma seja igual 
a i ou 7, e o número de jogadas necessárias até que isso ocorra é uma variável 
aleatória geométrica com RA P,+ P, Portanto, 


P; 


ae 4 Ds ts 


=1+2(3/9 + 4/10 + 5/11) = 3,376 


Para determinar E[Rljogador vence], comecemos determinando p, a probabili- 
dade de que o jogador vença. Condicionando em S, obtemos 
12 
p=> PlvitórialS = i)P; 
i=2 
6 
=P, +4 Py+ » 


P; E 


RA Rd ne: 
P+P' Dre 
= 0,493 
onde o desenvolvimento anterior usa o fato de que a probabilidade de se obter 
uma soma igual a i antes de uma soma iguala 7 é P/(P, + P)). Agora, vamos de- 


terminar a função de probabilidade condicional de S dado que o jogador vença. 
Fazendo Q, = P(S = iljogador vence), obtemos 


0,=-0,=0,=0, 0,=P/p, Qu = Pulp 
e, para i = 4,5,6,8,9,10 


P(S = i, jogador vence) 


O: = Pfvitória) 
— PiPlvitórialS =) 
Pp 
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p 
p(P; + Pj) 

Agora, condicionando na soma inicial, obtemos 

ElRvitória] = >" E[RIvitória, S = iJQ; 

i 

Entretanto, como já havia sido notado no Exemplo 2j do Capítulo 6, se a 
soma inicial for i, o número de jogadas adicionais necessárias e o resultado 
do jogo (seja ele uma vitória ou uma derrota) são independentes (isso é 
visto facilmente notando-se primeiro que, dada uma soma inicial i, o resul- 
tado é independente do número de jogadas adicionais necessárias; depois, 
usando-se a propriedade de simetria da independência, que diz que, se o 


evento A é independente do evento B, então o evento B é independente do 
evento 4). Portanto, 


ElRivitória] = 28 RIS=JQ 


= 2,938 


Embora pudéssemos determinar E[R|jogador perde] exatamente como ob- 
tivemos E[Rljogador vence], é mais fácil usar 
E[R] = E[Rljogador vence] + E[Rljogador perdeJ(1 — p) 
o que implica que 
E[R] — ElRlijogador vence]p 


LE» = 3,801 


E[Rl|jogador perde] = 


Exemplo 5f 


Conforme definido no Exemplo 5c do Capítulo 6, a função densidade conjunta 
normal bivariada das variáveis aleatórias X e Y é 


2 
1 1 X— dx Ê y— Hy 
4,)=——— = exp |- ( ) + [—— 
Fe 2x0x0yv 1 — p2 E 21 — 02) Ox oy 


20 (e — JO — uy) 


0x0y 
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Vamos agora mostrar que p é a correlação entre X e Y. Conforme mostrado no 
Exemplo Sc, u, = E[X],02 = Var(X), e “, = E[Y], o; = Var(Y). Conseguente- 
mente, 
Cov(X,Y) 
0x0y 
= E(XY] — Vxky 
0x0y 


Corr(X, Ww= 


Para determinar E[XY], condicionamos em Y. Isto é, usamos a identidade 


EIXY] = ELE(XY|Y]) 


Relembrando do Exemplo 5c que a distribuição condicional de X dado que Y = 
é normal com média uy + Ro (y — 1y), vemos que 


E(XYIY =) = ELXyIY =] 
=yE[X|Y =] 


0; 
fi + oO — 19] 
5y 
0; 
= yu + 0207? — my) 
9 
Consequentemente, 
0, 
ELXYIY] = Yu + 0? — uh) 
) 
o que implica que 
0; 
E(XY] = Eru + 9 EQ? — 80] 
y 
Ox 5) 
= uxE[Y] + 0 EMO — yr] 
y 
— Jx 2) E? 
= Uby + E (Ely ] n3) 
[95 
= dy + 0 Var(Y) 
ey 


= Uxly + pOxoy 


Portanto, 
POx0y 


Ox0y | 


Corr(X,Y) = 


Às vezes é fácil calcular E[X], e usamos a identidade condicional para calcular 
o valor esperado condicional. Essa abordagem é ilustrada em nosso próximo 
exemplo. 
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Exemplo 5g 


Considere n tentativas independentes, cada uma levando a um dos resulta- 
dos 1,..., k com respectivas probabilidades p,...., Pp Smpi=l Suponha 
que N, represente o número de tentativas que levam ao resultado i, i = 1,..., 
k. Para i < j, determine 


(a) EININ, > 0] e (b) ELNIN, > 1] 


Solução Para resolver (a), considere 


Então 
E(N) = E(NJI = 0JP( = 0) + E[N|I = 1]PU = 1) 
ou, equivalentemente, 
E[N] = E(NIN, = OJP(N, = 0) + E[NIN, > OJPIN, > 0) 


Agora, a distribuição incondicional de N, é binomial com parâmetros n, p.. 
Além disso, dado que N, = r, cada uma das n — r tentativas que não levam ao 
resultado i terão como saída, de forma independente, o resultado j com proba- 
bilidade P(jjnão à) = p/(1 — p;). Consequentemente, a distribuição condicional 
de N, dado que N, = r, é binomial com parâmetros n — r, p/(1 — p;) (para um 
argumento mais detalhado para essa conclusão, veja o Exemplo 4c do Capítulo 
6). Como P(N, = 0) = (1 — p;)",a equação anterior resulta em 
Dj 

1— pi 


npj=n 1 — p)” + ELNIN; > 0Jd — A — pi” 


dando o resultado 


1-1 - py 


EIN;IN; Rc 0] = np; EE a T por 
i 


Podemos resolver a letra (b) de maneira similar. Considere 


O, seN;=0 
J=+11, seN;=1 
2, seN; > 1 


Então 
EIN] = E[NJJ = 0JP(J = 0) + EINH =1]PJ=1)+ EIN =2|PJ =2) 
ou, equivalentemente, 


E[N] = E[NIN, = OJPIN, = 0) + E[NAN, = 1]P(N, = 1) + E[NIN, > 1P(N,> 1) 
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Essa equação leva a 
Dj n 
(1 = por de qm = 1) 
do Di Ro Pi 


+ EWNjIN;> Ja = 4 — po)" = npid — pb) 


P; = 
npj=n 1 pd — py! 


dando o resultado 


npl- =p Dol - pr? 


EIN;N,; W= 
INN >] 1-(1-p)"- npid- py E 


Também é possível obter a variância de uma variável aleatória usando con- 
dições. Ilustramos essa abordagem no próximo exemplo. 


Exemplo 5h Variância da distribuição geométrica 


Tentativas independentes, cada uma com probabilidade de sucesso p, são reali- 
zadas sucessivamente. Suponha que N seja o instante de ocorrência do primei- 
ro sucesso. Determine Var(N). 


Solução Considere Y = 1 se a primeira tentativa resultar em sucesso e Y = 0 
caso contrário. Agora, 


Var(N) = EN? - (EIN)? 
Para calcular E[N”], condicionamos em Y da seguinte maneira: 
EIN? = ELEIN'|Y]) 
Entretanto, 
EWN|yY=1]=1 
E[N'|Y = 0] = E[(1 + N)) 

Essas duas equações são obtidas porque, por um lado, se a primeira tentati- 
va resultar em sucesso, então, claramente, N = 1; assim, Nº = 1. Por outro lado, 
se a primeira tentativa for fracassada, então o número total de tentativas ne- 
cessárias para O primeiro sucesso terá a mesma distribuição que 1 (a primeira 
tentativa que resulta em um fracasso) mais o número necessário de tentativas 
adicionais. Como a última grandeza tem a mesma distribuição que N, obtemos 
ELN?|Y = 0] = E[(1 + N)]. Com isso, 

EN] = E[N?|Y =1]P(Y =1) + E(N*!|Y =0]PW =0) 
=p + (1 DEI + N/] 
=1+(1- pERLN + NJ] 


Entretanto, conforme mostrado no Exemplo 8b do Capítulo 4, E[N] = 1/p; por- 
tanto 


E[N?] = 1 + 


E + q - PEIN 
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ou 
DE ques 
EIN?]= "52 
Pp 
Conseguentemente, 
Var(N) = E[N?] — (E(N]? 
E) 
pe p 
as 
p? n 
Exemplo 5i 


Considere uma situação de jogo em que há r jogadores, com o jogador i pos- 
suindo inicialmente n, unidades, n, > 0,i = 1,..., r. Em cada rodada, dois dos 
jogadores são escolhidos para jogarem uma partida. O vencedor dessa partida 
recebe 1 unidade do perdedor. Qualquer jogador cuja fortuna cair para O é eli- 
minado, e isso continua até que um único jogador possua todas as n = 5: 4 ni 
unidades. Esse jogador é chamado de campeão. Supondo que os resultados das 
partidas sucessivas sejam independentes e que cada partida tenha a mesma 
probabilidade de ser vencida por qualquer um dos jogadores, determine o nú- 
mero médio de rodadas até que um dos jogadores possua todas as n unidades. 


Solução Para determinar o número esperado de rodadas jogadas, suponha 
primeiro a existência de apenas 2 jogadores, com jogadores 1 e 2 possuindo je n 
—j unidades, respectivamente. Suponha que X represente o número de rodadas 
jogadas, e que m, = E[X,]. Então, para j = 1,...,n—1, 

AH LPA, 
onde À, é o número adicional de rodadas necessárias além da primeira. O cál- 
culo das esperanças fornece 


m,=1+ E[4) 
Condicionando no resultado da primeira rodada, obtemos 


m;= 1 + E[A]1 vence a primeira rodadaJ1/2 
+ E[A|2 vence a primeira rodadaJ1/2 


Agora, se o jogador 1 vence a primeira rodada, então a situação a partir daí é 

exatamente igual a de um problema que suponha que o jogador 1 comece com 

j + 1 unidades e o jogador 2, com n — (; + 1) unidades. Consequentemente, 
E[A|l vence a primeira rodada] = m,., 


e, de forma análoga, 


ELA Ep: vence a primeira rodada] = m, , 
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Logo, 


1 1 
m;=1 + dd + SIA 


ou, equivalentemente, 


Mia =2m;-m-2  j=1on-1 (5.4) 


E) 
Usando-se m, = 0, a equação anterior resulta em 
mo = 2m1 — 2 
m=2m-m-2Z=3Im-6=3m — 2 
m=2m-m-—2=4m-—l2Z=4Mm-—-3) 


sugerindo que 
m,=(m,-i+ 1), i=1,.,n (5.5) 


Para demonstrar essa igualdade, usamos indução matemática. Como já mos- 
tramos que essa equação é válida para i = 1,2, assumimos como hipótese de 
indução que ela seja válida sempre que i =; < n. Devemos agora demonstrar 
que ela é válida para j + 1. Usando a Equação (5.4), obtemos 


mM = 2m; = mj — 2 
=2(m-j+D>-G-— D(m-j+2)-—2 (pela hipótese de indução) 
=G+Dm-WY+4+P-34+2-2 
=G+Dm -P-j 
=(4 + Dm —j) 


o que completa a demonstração por indução de (5.5). Fazendo i = n em (5.5) e 
usando m, = 0, obtemos 


m=n-1 
o que, novamente usando-se (5.5), fornece o resultado 
m,=i(n-i) 


Assim, o número médio de partidas jogadas quando há apenas 3 jogadores com 
quantias iniciais ie n — 1 é o produto de suas quantias iniciais. Como ambos os 
jogadores jogarão todas as rodadas, este também é o número médio de rodadas 
envolvendo o jogador 1. 

Vamos agora voltar para o problema que envolve r jogadores com quantias 
iniciais n,i = 1,...,1,);-4ni; = n. Suponha que X represente o número de ro- 
dadas necessárias para que exista um campeão, e que X, represente o número 
de rodadas envolvendo o jogador i. Agora, do ponto de vista do jogador i, co- 
meçando com n, ele continuará a jogar até que, de forma independente e com 
mesma probabilidade de vencer ou perder cada partida, sua fortuna seja igual 
an ou 0. Assim, o número de rodadas que ele jogará é exatamente o mesma 
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que ele jogaria caso tivesse um único adversário com fortuna inicial de n — n.. 
Consequentemente, pelo resultado anterior, tem-se que 


EX] = ní(n-n) 


então 
r r r 
E 3X = Domin — ni) =nº — > 
i=1 i=1 i=1 
Mas, como cada rodada envolve dois jogadores, 
1 r 
= 


Calculando as esperanças, obtemos 
1 r 
E[X] = A) nº — > 
i=1 


É interessante notar que, se por um lado nosso argumento mostra que o número 
médio de rodadas não depende da maneira pela qual os pares são selecionados 
em cada rodada, o mesmo não ocorre para a distribuição do número de rodadas. 
Para ver isso, suponha quer = 3,n,=n, = 1 en, = 2.Se os jogadores 1 e 2 são es- 
colhidos na primeira rodada, então serão necessárias pelo menos 3 rodadas para 
que tenhamos um vencedor. Por outro lado, se o jogador 3 estiver na primeira 
rodada, então é possível que sejam necessárias apenas duas rodadas. E 


Em nosso próximo exemplo, usamos condições para verificar um resultado 
já obtido na Seção 6.3.1: de que o número esperado de variáveis aleatórias uni- 
formes no intervalo (0, 1) que precisam ser somadas para que o resultado seja 
maior que 1 é igual a e. 


Exemplo 5j 


Seja U,, U,,... uma sequência de variáveis aleatórias independentes uniformes 
no intervalo (0, 1). Determine E[N] quando 


n 
N=mín fn: >u; > 1 
i=1 


Solução Vamos determinar E[N] obtendo um resultado mais geral. Para x E 
[0, 1], considere 


Rn 
NG) =mín 4n: > U; > x 
i=1 


408 Probabilidade: Um Curso Moderno com Aplicações 


e faça 
m() = EING)| 


Isto é, N(x) é o número de variáveis aleatórias uniformes no intervalo (0, 1) que 
precisamos somar até que o resultado seja maior que x, e m(x) é o seu valor 
esperado. Vamos agora deduzir uma equação para m(x) condicionando em U.. 
Com isso, obtemos, da Equação (5.1b), 


1 
m(x) / ING)IU, = y] dy (5.6) 
Agora, 


o a 1 sSey > X 
ELNGOIU, = y] = É +m(x — y) sey=<x (5.7) 


A fórmula anterior é obviamente válida quando y > x. Também é válida quan- 
do y = x, já que, se o primeiro valor for y, então, naquele momento, o número 
restante de variáveis aleatórias uniformes necessárias será o mesmo que tería- 
mos caso estivéssemos apenas começando e fôssemos somar variáveis aleató- 
rias uniformes até que o resultado fosse maior que x — y. Substituindo a Equa- 
ção (5.7) na Equação (5.6), obtemos 


m()=1+ À m(x — y)dy 


e fazendo 
=1+ o mtundu = 
Calculando a derivada da equação anterior, obtemos 

m'(o) = m(x) 


ou, equivalentemente, 


m'(x) 2 

m(x) 
Integrando essa equação, obtemos 

loglm(x)] =x + c 

ou 

m(x) = ke 
Como m(0) = 1, tem-se que k = 1, então obtemos 

m(x) = e 


Portanto, m(1), o número esperado de variáveis aleatórias uniformes no inter- 
valo (0, 1) que precisam ser somadas até que o resultado seja maior do que 1 é 
igual a e. = 
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7.5.3 Calculando probabilidades usando condições 


Não só podemos obter esperanças condicionando em uma variável aleatória 
apropriada, mas também podemos usar essa abordagem para calcular probabi- 
lidades. Para ver isso, suponha que E represente um evento arbitrário e defina 
a variável aleatória indicadora X como 


1 seEocorrer 
X= E 
O se Enão ocorrer 


Resulta da definição de X que 
EX] = P(E) 
E[X|Y =»]= P(EIY =y) para qualquer variável aleatória Y 


Portanto, das Equações (5.1a) e (5.1b), obtemos 
P(E) = 3 PEIy = »pP(Y =») seYé discreta 
y 
» (5.8) 
= / P(EIY =yfrO)dy se Yé contínua 
OO 


Note que, se Y é uma variável aleatória que assume um dos valores y,,..., Y,» 
então, definindo-se os eventos F, i = 1,...,n,com F, = (Y = y),a Equação (5.8) 
reduz-se à equação familiar 


P(E) = > P(EIFDP(F)) 
i=1 


onde F,,..., F, são eventos mutuamente exclusivos cuja união é o espaço amostral. 


Exemplo 5k O problema do melhor prêmio 


Suponha que recebamos n prêmios distintos em sequência. Após recebermos 
um prêmio, devemos imediatamente aceitá-lo ou rejeitá-lo. Caso o rejeitemos, 
podemos receber o próximo prêmio. A única informação que temos quando 
decidimos se ficamos ou não com o prêmio é o seu valor em comparação com 
aqueles já vistos. Isto é, por exemplo, quando o quinto prêmio é sorteado, sa- 
bemos o quanto ele vale em relação aos quatro prêmios já oferecidos. Suponha 
que, uma vez que o prêmio tenha sido rejeitado, ele seja perdido, e que nosso 
objetivo seja maximizar a probabilidade de obtermos o melhor prêmio. Supon- 
do que todas as n! sequências de prêmios sejam igualmente prováveis, quão 
bem podemos nos sair? 


Solução Surpreendentemente, podemos nos sair muito bem. Para ver isso, 
fixe um valor k,0 = k < n,e considere a estratégia de rejeitar os primeiros k 
prêmios e depois aceitar o primeiro prêmio que for melhor do que estes. Supo- 
nha que P,(melhor) represente a probabilidade de que o melhor prêmio seja 
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selecionado com o emprego dessa estratégia. Para calculá-la, condicionamos 
em X, a posição do melhor prêmio. Isso dá 


n 
Py(melhor) = 5 Pk(melhor|X = )P(X = i) 
i=1. 


1 n 
= > Pe(melhor|X =1) 
i=1 


Agora, por um lado, se o melhor prêmio estiver entre os primeiros k prêmios, 
então nenhum prêmio será selecionado de acordo com a estratégia considera- 
da. Isto é, 


Pkmelhor|X = )=0  sei=k 


Por outro lado, se o melhor prêmio estiver na posição i, onde i > k, então o 
melhor prêmio será selecionado se o melhor dos primeiros i — 1 prêmios es- 
tiver entre os primeiros k prêmios (pois nesse caso nenhum dos prêmios nas 
posições k + 1,k + 2,...,i —- 1 será selecionado). Mas, condicionando no melhor 
prêmio estar na posição i, é fácil verificar que todas as possíveis ordenações 
dos demais prêmios permanecerão igualmente prováveis. Isso implica o fato de 
cada um dos primeiros i - 1 prêmios poder ser o melhor do conjunto de manei- 
ra igualmente provável. Com isso, temos 


P Xmelhor|X = i) = Pfmelhor dos primeiros i — 1 estar entre os primeiros k|X = i] 


=. sei>k 
i—l 
Do argumento anterior, obtemos 
a e 
P,(melhor) = — a 
n. i—l 
i=k+1 


k [” 1 
=| dx 
nJuix— 1 


Q 
sx 
o 
GQ 
PE, 
eps 
so 


então 
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com isso 
n n 
4 =0 ] — =1 Eu 
g (x) => log (=) md dm 


Assim, como P, (melhor) = g(k), vemos que a melhor estratégia a ser conside- 
rada é dispensar os primeiros n/e prêmios e então aceitar o primeiro prêmio 
que for melhor do que todos eles. Além disso, como g(n/e) = 1/e,a probabilida- 
de de que esta estratégia resulte na seleção do melhor prêmio é de aproxima- 
damente 1/e = 0,36788. 


Observação: A maioria das pessoas fica surpresa com a grande pro- 
babilidade de se obter o melhor prêmio, pensando que essa probabilidade 
deveria tender a O quando n é muito grande. Entretanto, mesmo sem fazer 
nenhuma conta, um pouco de raciocínio revela que a probabilidade de se 
obter o melhor prêmio pode ser razoavelmente grande. Considere a estra- 
tégia de dispensar a metade dos prêmios e então selecionar o primeiro que 
aparecer que for melhor do que todos eles. A probabilidade de que um prê- 
mio seja de fato selecionado é a probabilidade de que ele seja o melhor em 
geral da segunda metade dos prêmios, e isso é igual a ê. Além disso, dado que 
um prêmio tenha sido selecionado, no momento da seleção aquele prêmio 
terá sido o melhor dentre mais de n/2 prêmios que foram oferecidos, e terá 
portanto uma probabilidade pelo menos igual a i de ser o melhor em geral. 
Com isso, a estratégia de dispensar a primeira metade de todos os prêmios e 
então aceitar o primeiro prêmio que for melhor do que todos eles resulta em 
uma probabilidade superior a E de se obter o melhor prêmio. E 


Exemplo 5! 


Seja U uma variável aleatória uniforme no intervalo (0, 1), e suponha que a 
distribuição condicional de X dado que U = p seja binomial com parâmetros n 
e p. Determine a função de probabilidade de X. 


Solução Condicionando no valor de U, obtemos 
1 
PX=ij= / PIX = ijU = p)fup) dp 


1 
-[ P(X =ijU =pjdp 
0 


n! 


1 
= 1 so n-i 
TESE E EA Ps 


Pode-se mostrar agora que (uma demonstração probabilística é dada na Se- 
ção 6.6) 


in — d)! 


1 
id — nSidn= O 
pri pj" dp (4 D 
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Com isso, obtemos 


PX=i)= aa i=0,...,n 
n+1 
Isto é, obtemos o resultado surpreendente de que se uma moeda com probabi- 
lidade uniformemente distribuída em (0, 1) de dar cara é jogada n vezes, então 
o número de caras que aparecem tem a mesma probabilidade de ser qualquer 
um dos valores Ô,...,n. 

Como a distribuição condicional anterior tem uma forma bastante sim- 
ples, vale a pena tentarmos obter um argumento que nos torne mais confiantes 
quanto à sua validade. Para fazer isso, suponha que U, U,...., U, sejam n + 1 
variáveis aleatórias independentes uniformes no intervalo (0,1),e que X repre- 
sente o número de variáveis aleatórias U,,..., U, que são menores que U. Como 
todas as variáveis aleatórias U, U,...., U, têm a mesma distribuição, tem-se que 
U tem a mesma probabilidade de ser o menor, o segundo menor, ou o maior de- 
les; então X tem a mesma probabilidade de assumir qualquer um dos valores 0, 
1,...,n. Entretanto, dado que U = p,o número de variáveis U, que são menores 
que U é uma variável aleatória binomial com parâmetros n e p,o que confirma 
nosso resultado anterior. E 


Exemplo 5m 


Suponha que X e Y sejam variáveis aleatórias contínuas independentes com 
densidades f, e f, respectivamente. Calcule P(X < )Y). 


Solução Condicionando no valor de Y, obtemos 


P(X < Yj= PX <YIY=yfrO)dy 


—00 


E f PX <yY=yfro)ay 


ll 


MÁ P(X < yvify(vidy pela independência 
—00 


É f “ Feyfro) dy 


onde 


y 
Fx0) = f eo de 


Exemplo 5n 


Suponha que X e Y sejam variáveis aleatórias contínuas independentes. Deter- 
mine a distribuição de X + Y. 
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Solução Condicionando no valor Y, obtemos 


PX + Y< a=[ Px +Y <alY=yfyO)dy 


a) PX +y<aY=-yfQdy 


—00 


= PX <a — yfyr0)dy 


—00 


= / Fx(a — WfyQ)dy 


7.5.4 Variância condicional 


Assim como definimos a esperança condicional de X dado o valor de Y, tam- 
bém podemos definir a variância de X dado que Y = y: 


Var(X]Y) = EX = EX] 


Isto é, Var(X|Y) é igual à esperança (condicional) do quadrado da diferença 
entre X e sua média (condicional) quando o valor de Y é dado. Em outras pala- 
vras, Var(X|Y) é exatamente análoga à definição usual de variância, mas agora 
todas as esperanças estão condicionadas no fato de Y ser conhecido. 

Há uma relação útil entre Var(X), a variância incondicional de X, e 
Var(X|Y), a variância condicional de X dado Y, que pode ser muitas vezes apli- 
cada no cálculo de Var(X). Para obter essa relação, note primeiro que, pelo 
mesmo raciocínio que leva a Var(X) = E[X?] - (E[X]), temos 


Var(X|Y) = Ep|Y] = (ELXivIP 
então 
E[Var(X|Y)] = ELE |Y]] — EIEIXIYD?) 
= EIX?] — ElELXIYD?) (5.9) 

Também, como E[E[X|Y]] = E[X], temos 

Var(E[X|Y]) = ELCEIXIYI? - (EDP (5.10) 
Assim, somando as Equações (5.9) e (5.10), chegamos à seguinte proposição. 
Proposição 5.2 A fórmula da variância condicional é 


Var(X) = E[Var(X|Y)] + Var(EIXIY)) 


Exemplo 5o 


Suponha que o número de pessoas que chegam em uma estação de trem em qual- 
quer instante t seja uma variável aleatória de Poisson com média At. Se o primeiro 
trem chega na estação em um instante de tempo que é uniformemente distribuído 
ao longo de (0, T) e independente do instante de chegada dos passageiros, quais 
são a média e a variância do número de passageiros que entram no trem? 
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Solução Para cada t > 0, suponha que N(t) represente o número de chegadas 
até o instante t e faça com que Y represente o instante de chegada do trem. A 
variável aleatória de interesse é então N(Y). Condicionando em Y, obtemos 


EINCOIY =] = ELNGIY = d] 
= EIN()] pela independência de Y e N(t) 
=At já que N(t) é Poisson com média At 


Com isso, 


EIN] = AY 


e o cálculo das esperanças resulta em 


ENO] =AE[M] = 


Para obtermos Var(N(Y)), usamos a fórmula da variância condicional: 
Va(NOO]Y = 9) = Var(N(B|Y = 8 
= Var(N(t)) pela independência 
=A 
Assim, 
Var(N(MIY) = AY 
EINN|Y]=AY 


Portanto, da fórmula da variância condicional, 
Var(N(Y) = E[AY] + Var(AY) 


T Te 
=1> + 2 
ANA 
onde usamos o fato de que Var(Y) = T'/12. = 


Exemplo 5p Variância da soma de um número aleatório 

de variáveis aleatórias 

Seja X,, X,,.. uma sequência de variáveis aleatórias independentes e identi- 
camente distribuídas, e suponha que N seja uma variável aleatória de valor 
inteiro não negativo que é independente da sequência X,, i = 1. Para calcular 


N 
Var | 5) X; | condicionamos em N: 
i=1 


N 
E E X;IN | = NE[X] 
i=l 


i=1 


N 
Var [E san) = NVar(X) 
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. Obtemos o resultado anterior porque, dado N, Et 1X; é justamente a soma de 
um número fixo de variáveis aleatórias independentes. Por isso, sua esperança e 
variância são justamente as somas das médias e variâncias individuais, respecti- 
vamente. Portanto, da fórmula da variância condicional, 


N 
Var [> «) = E[N]Var(X) + (E[X)Var(N) 
i=1 


7.6 ESPERANÇA CONDICIONAL E PREDIÇÃO 


Às vezes, surge uma situação em que o valor de uma variável aleatória X é ob- 
servado e então, com base no valor observado, tenta-se prever o valor de uma 
segunda variável aleatória Y. Suponha que g(X) represente o preditor; isto é, se 
X é observado como sendo igual a x, então g(x) nos fornece uma predição para 
o valor de Y. Claramente, queremos escolher g de forma que g(X) se aproxime 
de Y. Um possível critério é escolher g de forma a minimizar E[(Y — 8019). 
Mostramos agora que, de acordo com esse critério, o melhor preditor possível 


de Yé g(X) = E[Y|X. 
Proposição 6.1 
ELO - 80097] = ELO - ELIXI/] 
Demonstração 
ELY — g00YIX] = ELO — E[YIX] + ELYIX] — g 002] 
= E[(Y — E[WIXP|X] 
+ EIELIX] — g0071X] 
+ 2EIY — E(IXDEIIX] — 8X] (6.1) 
Entretanto, dado X, E[Y|X] — g(X), sendo uma função de X, pode ser trata- 
do como uma constante. Assim, 
EM — EMIXPEIMIX] — g(ADIX] 
= (E[YIX] — g(XDEIY — E[YIXTIX] 
= (E[YIX] — g0O0OXE[YIX] — ELYIX]) 
=0 (6.2) 
Portanto, das Equações (6.1) e (6.2), obtemos 


EL = s00)/1] = EICY - EYIXIPP 


e o resultado desejado é obtido calculando-se as esperanças de ambos os 
lados da expressão anterior. 0 
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Observação: Um segundo argumento, mais intuitivo porém menos rigo- 
roso, que pode ser usado para se verificar a Proposição 6.1 é dado a seguir. É 
simples verificar que E[(Y — c)”] é minimizado em c = E[Y] (veja o Exercício 
Teórico 71). Assim, se queremos predizer o valor de Y quando não dispomos 
de dados para isso, a melhor predição possível, no sentido de se minimizar o 
erro médio quadrático, é dizer que Y será igual à sua média. Entretanto, se o 
valor da variável aleatória X é observado como sendo x, então o problema da 
predição permanece exatamente igual ao caso anterior (não há dados), com a 
exceção de que todas as probabilidades e esperanças estão agora condiciona- 
das ao evento X = x. Com isso, a melhor predição nesta situação é dizer que Y 
será igual ao seu valor esperado condicional dado que X = x, o que estabelece 
a Proposição 6.1. O 


Exemplo 6a 


Suponha que o filho de um homem com altura x (em cm) atinge uma altura 
que é normalmente distribuída com média x + 2,54 e variância 10,16. Qual é 
a melhor predição da altura que o filho irá atingir se o seu pai tem 1,83 m de 
altura? 


Solução Formalmente, este modelo pode ser escrito como 
Y=X+254+e 


onde e é uma variável aleatória normal, independente de X, com média O e 
variância 10,16. As variáveis aleatórias X e Y representam, naturalmente, as 
alturas do pai e do filho, respectivamente. A melhor predição E[Y|X = 183] é 
portanto igual a 
E(YIX =183]= E[X + 1 + eX = 183] 

=185,4 + Ele|X = 183] 

= 185,4 + E(e) pela independência 

= 185,4 [| 


Exemplo 6b 


Suponha que, se um sinal com valor s é enviado do ponto 4, o valor recebido no 
ponto B seja normalmente distribuído com parâmetros (s, 1). Se $, o valor do 
sinal enviado em A, é normalmente distribuído com parâmetros (ju, o”), qual é a 
melhor estimativa para o sinal enviado se R, o valor recebido em B, é igual a 7? 


Solução Comecemos calculando a densidade condicional de S dado R. Temos 


— fsr(s,n) 
fsrósln) = ESOM 


— fsOfrisCrIs) 
fr(r) 


= Ke tu)? /20? (1-5? /2 
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onde K não depende de s. Agora, 


aa da áalo 
(s— uu) qd 5) o(s +5)-(E+)sta 


20? 2 2 02 
1+0? 2 u + ro? 
E eo ER é 
202 i 1+02 E aa 


2 
Lo (u + ro?) 
20? E 


onde €, e C€, não dependem des. Portanto, 


o Da 
1+02 


onde € não depende de s. Logo, podemos concluir que a distribuição condicio- 
nal de S, o sinal enviado dado que r tenha sido recebido, é normal com média e 
variância dadas agora por 


fsr(slr) = Cexp 


u+ ro? 
E(SIR=r|=>—— 
Pa 1+0? 

2 
Var(S|R =) = -——s 
ar(SR=0= 3 


Consequentemente, da Proposição 6.1, dado que o valor recebido é r,a melhor 
estimativa para o valor enviado (no sentido de se minimizar o erro médio qua- 
drático) é 


02 


EISR="]= E TER 


1+ Ega 
Escrever a média condicional como acabamos de fazer é informativo, pois isso 
mostra que ela é igual a uma média ponderada de py, o valor esperado do sinal 
a priori, e r, o valor recebido. Os pesos relativos dados a g e r têm entre si a 
mesma proporção que 1 (a variância condicional do sinal recebido quando s é 
enviado) tem para o” (a variância do sinal enviado). E 


Exemplo 6c 


No processamento digital de sinais, é necessário discretizar dados analógi- 
cos X para se obter uma representação digital. Para que isso seja feito, um 


conjunto crescente de números a, i = 0, +1, +2...., tal que lim ag =c0e 
i=>++oo 
lim a;=—oo, é fixado, e os dados analógicos são então discretizados de 
i—> —oo 
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acordo com o intervalo (a, a,,,] no qual X está contido. Vamos chamar de 
y; O valor discretizado de X E (a, a,,1] e fazer com que Y represente o valor 
discretizado observado — isto é, 


Y=y, sea<X<a,, 
A distribuição de Y é dada por 
PY = y) = Fa) = Fa) 


Suponha agora que queiramos escolher os valores y, i = 0, +1, +2,... que 
Dao 2 ja as 
minimizem E[(X — Y)'], o valor esperado do erro médio quadrático entre os 
dados originais e sua versão discretizada. 


(a) Determine os valores ótimos y,i = 0, +1..... 
Para a discretização ótima Y, mostre que 

(b) E[Y] = E[X], de forma que a discretização que minimiza o erro médio 
quadrático também preserve a média do sinal de entrada; 


(e) Var(Y) = Var(X) - EX = Y)). 


Solução (a) Para qualquer discretização Y, obtemos, condicionando no valor 
de Y, 


EX -Y]=5 EX — ya <X = ana <X <a) 


Agora, se fizermos 
I=i sea<X<a,, 
então 
EMX-yPla<X = a) = EMX-yI = 1] 
e, pela proposição 6.1, essa grandeza é minimizada quando 
yi= H[XI = i 
= ElXla; < X < aj] 
= [ ai xfx (x) dx 
a xa) — Fx(ai) 
Agora, como a discretização ótima é dada por Y = [El], obtemos 
(b) E[Y] = ELX] 


(e) Var(X) = E[Var(X|D] + Var(E[XI|I]) 


= E(EU(X — Y)21]] + Var(Yy) 
= EMX — Y)] + Var(Y) = 
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Às vezes, acontece da distribuição de probabilidade conjunta de X e Y não 
ser completamente conhecida; ou, se for conhecida, ela ser tal que o cálculo de 
E[Y|X = x] seja matematicamente intratável. Se, no entanto, a média, a variân- 
cia e a correlação de X e Y são conhecidos, então podemos pelo menos deter- 
minar o melhor preditor linear de Y com respeito a X. 

Para obter o melhor preditor linear de Y com respeito a X, precisamos es- 
colher a e b que minimizem E((Y — (a + bX))]. Agora, 


EMY-(a + bX))] = E[Y -20Y -2bXY + dº + 2abX + b'X] 
= E[Y]- 20E[Y] = 2bE[XY] + à? + 2abE[X] + bE(X”] 
Calculando as derivadas parciais, obtemos 


SEIO —-a- bX)2]=-2E[Y] + 2a + 2bE[X] 


(6.3) 
SELO? - a - bX)]=-2E[XY] + 24E[X] + 2bE[X?] 
Igualando a zero as Equações (6.3) e resolvendo para a e b, obtemos 
ts E(XY] — EIXJE[Y]  Cov(X,Y) 0y 
“CER2)— Ep O o Pa 
poy E[X] 
= E[Y| — bE[X] = E[Y] — ———— 
a = E[Y] — bELX] = B[v] — E nt 


onde p = Correlação(X,Y), 02 = Var(Y) e o2 = Var(X). É fácil verificar que 
os valores a e b da Equação o 4) minimizam EI - a- bX)']; assim, o melhor 
preditor linear de Y com respeito a X (em termos do erro médio quadrático) é 


dy + UK — ta) 


onde q, = E[Y]e wu, = E(X]. 
O erro médio quadrático desse preditor é dado por 


0y 2 
E (7 — dy — o — 7) 


=E[Y -w?|+» Seo — ua?) - 20 GELO — uy — no] 
= E; + pras. — 20205 
=o;(1 — 0?) 

(6.5) 


Observamos da Equação (6.5) que, se a correlação p está próxima de +1 ou 
—1, então o erro médio quadrático do melhor preditor linear é aproximada- 
mente nulo. = 
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Exemplo 6d 


Um exemplo no qual a esperança condicional de Y dado X é linear em X,e 
portanto no qual o melhor preditor linear de Y com respeito a X é o melhor 
preditor possível, é aquele em que X e Y têm uma distribuição normal bivaria- 
da. Pois, conforme mostrado no Exemplo 5c do Capítulo 6, nesse caso, 


Oy 
EUWIX =x]= uy + PO — uz) 
X 


7.7 FUNÇÕES GERATRIZES DE MOMENTOS 


As função geratriz de momentos M(t) da variável aleatória X é definida, para 
todos os valores reais de t, como 


M(t) = Efe'*] 
Do e*p(x) se X é discreta com função de probabilidade p(x) 
X 


oo 
/ e*f(x) dx se X é contínua com função de densidade f(x) 
—oo 


Chamamos M(t) de função geratriz de momentos porque todos os momentos 
de X podem ser obtidos com o cálculo sucessivo da derivada de M(t) e então 
com sua avaliação em t = 0. Por exemplo, 


M'(t) = é Efe ] 


= E(Xe*] (1) 


onde adotamos como legítima a hipótese da troca de ordem do cálculo da deri- 
vada e da esperança. Isto é, consideramos que 


d d 
a Aut = A ql PON] 


no caso discreto e 


“ [/ e f(x) ds E / Lero] dx 


no caso contínuo. Essa hipótese pode ser quase sempre justificada e, de fato, é 
válida para todas as distribuições consideradas neste livro. Portanto, da Equa- 
ção (71), avaliada em t = 0, obtemos 


MO) = E[X] 
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Similarmente, 
d 
dt 


d 
= — EXe* 
q EIXe 


=p [O san 
- El Gde | 


= E(X?e*] 


MD =-M'(t) 


Assim, 
M"(0) = E(X?] 
Em geral, a n-ésima derivada de M(t) é dada por 
M'(t) = EX en=1 
implicando que 
M“(0) = EX ]|n=1 
Agora computamos M(t) para algumas distribuições comuns. 


Exemplo 7a Distribuição binomial com parâmetros n e p 
Se X é uma variável aleatória binomial com parâmetros n e p, então 


Mto) = Efe] 
=3)et ()rta - py 
k=0 
Ee (:) pet — py 
k=0 


=(pé +1-p” 


onde a última igualdade resulta do teorema binomial. Calculando a derivada, 
obtemos 


M(BD=n(pe'+1-p)'pe 
Assim, 
EL] =M'(0) = np 
Calculando a derivada segunda, obtemos 
M“0) =n(n-Dpe +1-pJPpe + n(pe + 1-p)?pe 
então 


EX]=M“0)=n(n-Dp' +np 
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A variância de X é dada por 
Var(X) = E[X?] — (EX)? 
=n(n — Dp? + np — nºp? 
=np(l — p) 


o que verifica o resultado obtido anteriormente. n 


Exemplo 7b Distribuição de Poisson com média À 
Se X é uma variável aleatória de Poisson com parâmetro À, então 


M(9 = E[e*] 


o 


= exp(a(e — 1)) 


Calculando a derivada, obtemos 

M'(t) = Ae expfa(e — 1)) 

M'(t) = (Ae Vexpla(e — 1)) + Ae expla(e — 1)) 
Assim, 

EX]=M(0) =A 
EX]=M (0) = +A 
Var(X) = E[X?] — (EIX)? 
=A 


Portanto, a média e a variância de uma variável aleatória de Poisson são 
iguais a À. E 


Exemplo 7c Distribuição exponencial com parâmetro À 


M(o = Efe*] 
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Observamos dessa dedução que, para a distribuição exponencial, M(t) é definida 
apenas para valores de t menores que A. Calculando a derivada de M(t), obtemos 


2À 
M” ( t) = 


HU qem An 


Portanto, 
E[X] = M(0) = Ê E[X?]= M'(0) = a 
N A2 


A variância de X é dada por 
Var(X) = E[X?] — (ELX)? 
a 
RV [1] 


Exemplo 7d Distribuição normal 


Primeiro calculamos a função geratriz de momentos de uma variável aleatória 
normal padrão com parâmetros O e 1. Fazendo com que Z represente essa va- 
riável aleatória, temos 


Mz(t) = Efe'?] 
1 eo 2 
= =| eXe* /2 dx 


na Ê xo) CP -20) 
E 27 J-o E 2 


1 [0.0] AE 2 
ep [E + 5| dx 


= 2a —00 2 2 

RR F —(-12/2 

=e€-—— e dx 
27 —00 

= e 


Portanto, a função geratriz de momentos da variável aleatória normal padrão Z é 
dada por Mz(t) = e” /2. Para obter a função geratriz de momentos de uma variá- 
vel aleatória normal arbitrária, relembramos (veja a Seção 5.4) que X = up + oZ 
terá distribuição normal com parâmetros pg e o” sempre que Z for uma variável 
aleatória normal padrão. Portanto, a função geratriz de momentos dessa variável 
aleatória é dada por 


Mxtt) = Efe] 
ja E[e'4+92)] 
= Ele'te'2] 


= et Ele'2] 
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= e“Mz(to) 
= eugtoY 


= EX oiê + ut 
Ec Hu 
Calculando a derivada, obtemos 


Myt) = (u + to?) exp E + ut 
22 242 
[4 t 
My(b) = (u + tes | + a) + o? exp [SÉ + a 


Assim 
EX] = M(0) = 
EX]=M'0=u? + 0? 
o que implica que 
Var(X) = E[X?] — EX)? 


=9? E 


As Tabelas 7.1 e 72 fornecem as funções geratrizes de momentos de algu- 
mas distribuições discretas e contínuas comuns. 
Uma importante propriedade das funções geratrizes de momentos é a de 


que a função geratriz da soma de variáveis aleatórias independentes é igual ao 
produto das funções geratrizes individuais. Para provarmos isso, suponha que X 


Tabela 7.1 Distribuição de probabilidade discreta 


Função de Função geratriz de 
probabilidade, p(x) momentos, M(t) Média Variância 
Binomial com parâ- (1) pH — py 
metros n, p; x pe +1- py np np —p) 
0=p=1 x=0,1,...,n 
Ar 
Poisson com pará e“ E 
x! Es 
metro À > 0 exprA(e Hi A E 
x=0,1,2, 
GR com p( — py pé 1 1-p 
parâmetro DR SR 7) 
0=<p=<l x=1,2,... a p á 
Binomial negati "opa - pr r 
end sa r-1 pe! Fr rd — p) 
com parâmetros r, p; —— DD = Es 
Rese, á 1-d-pe| p p? 


n=r,r+1,... 


Tabela 7.2 Distribuição de probabilidade contínua 


Função densidade de probabilidade, f(x) 


Uniforme ao longo de 1 


(a,b) fo=|5-a 
0 


a<x<b 


Exponencial com parâ- 
metro A > 0 


Gama com parâmetros Ae (Ag 


AA >0 —— > x 20 
(54) f) = r() 

0 x <0 
Normal com parâmetros fode 1 e tr-u?/20? 


(1,0?) ro 


caso contrário 


Função geratriz de 
momentos, M(t) 


ei? — eta 


t(b — a) 


Variância 
(b— a? 
12 


Grp cjuesods ep sopepoudoig e / ojnyides 
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e Ysejam independentes e possuam funções geratrizes Mt) e MÁt), respecti- 
vamente. Então M ,.. v(t), a função geratriz de X + Y, é dada por 
Mxv(0) = Ef] 

e Efe Xe” 

— Ele Efe”] 

= Mx(OMy(1) 
onde a penúltima igualdade resulta da Proposição 4.1, já que X e Y são inde- 
pendentes. 

Outro importante resultado é o de que a função geratriz de momentos de- 

termina unicamente a distribuição. Isto é, se a função M,(t) existe e é finita em 


alguma região na vizinhança de t = 0, então a distribuição de X é unicamente 
determinada. Por exemplo, se 


Mx(f) = (5) (é + 1º, 


então resulta da Tabela 71 que X é uma variável aleatória binomial com parâ- 
metros 10 e > 


Exemplo 7e 
Suponha que a função geratriz de uma variável aleatória X seja dada por 
M(t) = CD Qualé P(X = 0)? 


Solução Vemos da Tabela 71 que M(t) = eX—D é a função geratriz de uma 
variável aleatória de Poisson com média 3. Portanto, pela correspondência que 
existe entre as funções geratriz e distribuição, X deve ser uma variável aleatória 
de Poisson com média 3. Assim, P(X = 0) = é”. a 


Exemplo 7f - Somas de variáveis aleatórias binomiais independentes 
Se Xe Y são variáveis aleatórias binomiais independentes com parâmetros (n, 
p) e (m,p), respectivamente, qual é a distribuição de X + YW? 


Solução A função geratriz de X + Y é dada por 


Mxsv(D = Mxy(OMy(b) = (pe +1 — pºpe + 1 — py? 
= (pe + 1 prt 
Entretanto, (pe' + 1 - p)”*” é a função geratriz de momentos de uma variável 


aleatória binomial com parâmetros m + n e p. Assim, esta deve ser a distribui- 
ção de X + Y. [n] 


Exemplo 7g Somas de variáveis aleatórias de Poisson independentes 


Calcule a distribuição de X + Y quando X e Y são variáveis aleatórias de Pois- 
son independentes com médias À, e À,, respectivamente. 
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Solução 
Mxr(D = Mx(DMy (bd) 
= explAy(e — 1)JexplAs(e — 1)) 
= exp((A + Az)(e — 1)) 


Portanto, X + Y tem uma distribuição de Poisson com média À, + À,, 0 que 
verifica o resultado dado no Exemplo 3e do Capítulo 6. E 


Exemplo 7h Somas de variáveis aleatórias normais independentes 
Mostre que, se X e Y são variáveis aleatórias normais independentes com res- 
pectivos parâmetros (11,07) e (42,02), então X + Y é normal com média q, + 
| e variância o2 + oZ. 
Solução 

Mxcv(0) = Mx0OMy() 


o2t2 oZt 
= exp TE + mat f exp e + Mal 


2 np 
+ t 
= exp | ice Erê 


2 + (a + con] 


que é a função geratriz de momentos de uma variável aleatória normal com 
média u, + H, e variância o? + o7. O resultado desejado é obtido porque a 
função geratriz determina unicamente a função de distribuição. E 


Exemplo 7i 


Compute a função geratriz de momentos de uma variável aleatória qui-quadra- 
do com n graus de liberdade. 


Solução Podemos representar essa variável aleatória como 
++ 


onde Z,,..., Z, são variáveis aleatórias normais padrão independentes. Seja M(t) 
sua função geratriz de momentos. Então, pelo desenvolvimento anterior, 


M( = (Efe? p" 
onde Z é uma variável aleatória normal padrão. Agora, 


Efe? | = — E Pe dx 
TM J-—-co 


1 oo 
eo dy ondeo? = (=p 


o 2a —00 


=0 


= (1-2) 
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onde a penúltima igualdade usa o fato de que a integral de uma função densi- 
dade normal com média O e variância o, é igual a 1. Portanto, 


Mt) = (1=21) E 


Exemplo 7j Função geratriz de momentos da soma de um número 
aleatório de variáveis aleatórias 


Seja X,, X,,... uma sequência de variáveis aleatórias independentes e identi- 
camente distribuídas, e suponha que N seja uma variável aleatória de valor 
inteiro não negativo independente da sequência X, i > 1. Queremos calcular a 
função geratriz de momentos de 


(No Exemplo 5d, a variável Y foi interpretada como a quantidade de dinheiro 
gasta em uma loja em um dado dia quando tanto a quantia gasta por um cliente 
quanto o número de clientes eram variáveis aleatórias.) 

Para calcular a função geratriz de momentos de Y, primeiro condicionamos 
em N da seguinte maneira: 


N n 
E | exp DX N=n|=El|exp > Xi N=n 
1 1 


=El|exp x 
1 

= [Mx(0]" 

onde 
Mx(t) = Efe'%] 
Portanto, 
Efe“ IN] = (M dO)” 

Assim, 


MAS) = EM AD)! 
Os momentos de Y podem agora ser obtidos com o cálculo das derivadas: 


Mt) = EMA) MAD] 
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Assim, 
E[Y] = My(0) 
= EIN(My (0 My(0)] 
= E(NEX] 
= ELNJE[X] (72) 
o que verifica o resultado do Exemplo 5d (nesse último conjunto de igualdades, 
usamos o fato que M,(0) = Efe] = 1). 
Também, 
MAO = EIN(N= DM AM (OP + NM ADM O] 
então 
E(Y?] = M$(0) 
= E(N(N — IXEIX)? + NE(X?]] 
= (EXD(EIN?] — EIND + EINJERO) 
= EINKEIDO) — (EX)? + (ELDEIN?] 
= E[N]Var(X) + (E(XDEIN?] (13) 
Portanto, das Equações (72) e (73), temos 


Var(Y) = E[N]Var(X) + (EIX)EIN?] — (EIND? 
= E[N]Var(X) + (ELX)?Var(N) u 


Exemplo 7k 


Suponha que Y represente uma variável aleatória uniforme no intervalo (0, 1) 
e que, dado que Y = p,a variável aleatória X tenha uma distribuição binomial 
com parâmetros n e p. No Exemplo 5k, mostramos que X tem a mesma proba- 
bilidade de assumir qualquer um dos valores 0, 1,...,n. Demonstre esse resulta- 
do usando funções geratrizes de momentos. 


Solução Para calcular a função geratriz de X, comece condicionando no valor 
de Y. Usando a fórmula para a função geratriz de momentos binomial, obtemos 


Efé|y =p]=(pe'+1-p) 


Agora, Y é uniforme em (0,1). Calculando as esperanças, obtemos 
1 
gfeX)= [ pé +1-py'do 
0 


1 E 
ne | y'dy (pela substituiçãoy=pe + 1 — p) 


1 ed D 1 


Ca et-— 1 

1 
== (16 eua 6 tomas dee 
n+1 
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Como esta é a função geratriz de momentos de uma variável aleatória que tem 
a mesma probabilidade de assumir qualquer um dos valores 0,1,...,n,o resulta- 
do desejado é obtido do fato de que a função geratriz de uma variável aleatória 
determina unicamente a sua distribuição. [na] 


7.7.1 Funções geratrizes de momentos conjuntas 


Também é possível definir a função geratriz de momentos conjunta de duas 
ou mais variáveis aleatórias. Isso é feito da seguinte maneira: para quaisquer n 
variáveis aleatórias X,,..., X,, a função geratriz conjunta, M(t,,...,t,) é definida, 
para todos os valores reais de t,,...,t,, como 


“3 tm 


M(t,...,sty) = EfetX1+-—+HnX4] 


As funções geratrizes de momentos individuais podem ser obtidas de M(t,,..., 
tn) fazendo com que todos os ts exceto um sejam iguais a zero. Isto é, 


Mx = E[e*] = M(0,...,0,1,0,...,0) 


onde + está na i-ésima posição. 

Pode-se demonstrar (embora a demonstração seja muito avançada para este 
texto) que a função geratriz conjunta M(t,,...,t,) determina unicamente a distri- 
buição conjunta de X,,..., X,. Esse resultado pode então ser usado para provar 
que as n variáveis aleatórias X,,..., X, são independentes se e somente se 


M(t,...stn) = My (ty) o Mx, (tn) (74) 


Para a demonstração em uma direção, se as n variáveis aleatórias são indepen- 
dentes, então 


M(t,....tn) = Efel121+:::+nAn)] 
= Efe" ... einkn] 
= E[e!41]... E[e'n4n] pela independência 
= My, (t)---Mx,(tn) 


Para a demonstração na outra direção, se a Equação (7.4) é satisfeita, então a 
função geratriz de momentos conjunta M(t,,..., t,) é igual à função geratriz con- 
junta de n variáveis aleatórias independentes, com a i-ésima dessas variáveis 
possuindo a mesma distribuição de X,. Como a função geratriz de momentos 
conjunta determina unicamente a distribuição conjunta, esta é a função que 
procuramos; portanto, as variáveis aleatórias são independentes. 


Exemplo 71 


Sejam X e Y variáveis aleatórias normais independentes, cada uma com média 
u e variância o”. No Exemplo 7a do Capítulo 6, mostramos que X + Ye X-Y 
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são independentes. Vamos agora obter esse resultado calculando sua função 
geratriz de momentos conjunta: 


Ejs] = Efet+9X+(-5)Y] 
— Efe +97 Efet-9Y] 
= eutrs)to?(t+s)2/2 ult-s)+o 2-2 /2 


2 222 
= eut+to 2 eS's 


Mas reconhecemos a expressão anterior como a função geratriz de momentos 
conjunta da soma de uma variável aleatória normal com média 2y e variância 
20º e uma variável aleatória normal independente com média O e variância 20º. 
Como a função geratriz conjunta determina unicamente a função distribuição 
conjunta, temos como resultado que X + Ye X- Y são variáveis aleatórias 
normais independentes. E 


No próximo exemplo, usamos a função geratriz de momentos conjunta para 
verificar um resultado que foi obtido no Exemplo 2b do Capítulo 6. 


Exemplo 7m 


Suponha que o número de eventos ocorridos seja uma variável aleatória de 
Poisson com média À, e que cada evento seja contado independentemente com 
probabilidade p. Mostre que o número de eventos contados e o número de 
eventos não contados são variáveis aleatórias de Poisson com respectivas mé- 
diasApeA(1-p). 


Solução Suponha que X represente o número total de eventos e que X, de- 
note o número de eventos contados. Para calcular a função geratriz conjunta 
de X,, o número de eventos contados, e de X —- X,, o número de eventos não 
contados, comece condicionando em X para obter 


Efe' Let —Xe) Dá — n] — e" Efe DAc|x = nJ 
=AGE+1- pf 
=(pó+A-per 


que procede porque, dado que X = n, X, é uma variável aleatória binomial com 
parâmetros n e p. Portanto, 


E[eE HAL x] = (pé + A — pet 


Calculando as esperanças de ambos os lados dessa equação, obtemos 
Ejet AO = Ele + — e] 
Agora, como X é Poisson com média À, tem-se que Efe'* = eMe'—1), Portanto, 
para qualquer valor a positivo, vemos (fazendo a = e”) que E[a”] = e”. Logo, 
E[CXHA-XM = MPEHI-DE-) 
= APMED Ad-pXe-1) 
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Como a expressão anterior é a função geratriz conjunta de variáveis aleatórias 
de Poisson com respectivas médias Ap e A(1 — p),o resultado está provado. 


7.8 PROPRIEDADES ADICIONAIS DAS 
VARIÁVEIS ALEATÓRIAS NORMAIS 


7.8.1 A distribuição normal multivariada 


Sejam Z,,..., Z, um conjunto de n variáveis aleatórias normais padrão indepen- 
dentes. Se, para algumas constantes Aplsismisjsnemisism, 


Xi =anZi +: + anZn + Mm 
Ko =anZy + + anZn + u2 


Xi=anZi +: + ainZn + Wi 


Xm = 4121 + e: + âmmZn + Um 


diz-se que as variáveis aleatórias X,,..., X, possuem uma distribuição normal 
multivariada. 

Como a soma de variáveis aleatórias independentes também é uma variá- 
vel aleatória normal, tem-se que cada X, é uma variável aleatória normal com 
média e variância dadas, respectivamente, por 


EX] = ui 
n 
Var(X;) = 5 aj; 
j=1 
Vamos agora considerar 
M(t....t,) = ElexpltX, +... + 1,X,]] 
que é a função geratriz de momentos conjunta de X,,..., X,. A primeira coisa 
m 
a ser notada é que, como 5" 1X; é ela própria uma combinação linear das va- 
i=1 


riáveis aleatórias normais independentes Z,,..., Z,, ela também é normalmente 
distribuída. Sua média e variância são 


m m 
E e 6X; | = do bimi 
i=1 i=1 
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m 


m m 
Var > tX; | = Cov By Xi, a 1X; 
i=1 i=1 =1 


mm 
= e o ti Cov(X;, X;) 


2 4 CS 2a: A, . 2 a) 
Agora, se Y é uma variável aleatória normal com média q e variância o”, então 
2: 
E[e] = My (les = 40 12 


Assim, 


m mm 
1 
M(n,...,tm) = exp ) ti + 5 ) ) tyCov(Xi, X;) 
i=1 ELE 


o que mostra que a distribuição conjunta de X,...., X, é completamente determi- 
nada a partir do conhecimento dos valores de E[X,] e Cov(X,, Xp, ij=1,.,m. 

Pode-se mostrar que, quando m = 2, a distribuição normal multivariada se 
reduz ao caso particular de uma distribuição normal bivariada. 


Exemplo 8a 


Determine P(X < Y) para as variáveis aleatórias normais bivariadas X e Y com 
parâmetros 


Hx = EIX], 1 = E[Y], 02 = Var(X), 0; = Var(Y), p = Corr(X,Y) 


Solução Como X — Y é normal com média 
EX-YN=n—u, 
e variância 
Var(X — Y) = Var(X) + Var(-Y) + 2Cov(X, —Y) 
= o2 + o; — 2p0x0y 
obtemos 
P(X <YW=PX-—-Y<o 


Ho VW ty). —(Ux — by) 


o2 + oz — 2p0x0y (2 + oz — 2p0x0y 


= My — Hx 
Va + O — 2p0x0y 
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Exemplo 8b 


Suponha que a distribuição condicional de X dado que € = 6 seja normal com 
média O e variância 1. Suponha também que O seja uma variável aleatória nor- 
mal com média p e variância o”. Determine a distribuição condicional de O 
dado que X = x. 


Solução Em vez de usar e simplificar a fórmula de Bayes, vamos solucionar 
este problema primeiro mostrando que X, O possui uma distribuição normal 
bivariada. Para fazer isso, note que a função densidade conjunta de X, O pode 
ser escrita como 


frelx,8) = Faolx19)fo(9) 


onde fe(x|9) é uma função densidade normal com média 6 e variância 1. 
Entretanto, se Z for uma variável aleatória normal padrão independente de 
O, então a distribuição condicional de Z + O dado que O = 6 também será 
normal com média 9 e variância 1. Consequentemente, a densidade conjunta 
de Z + 0, O é igual aquela de X, O. Como a primeira densidade conjunta é 
claramente normal bivariada (já que Z + O e O são combinações lineares das 
variáveis aleatórias normais independentes Z e Q), resulta que X, O possui 
distribuição normal bivariada. Agora, 
EX] = Elz + O]=u 
Va(X)=Var(Z + O)=1+0? 


p = Corr(X,0) 
= Corr(Z + 0,0) 
Cov(Z + 0,0) 
vVar(Z + O)Var(0) 
o 


sd +02 


Como X, O possui distribuição normal bivariada, a distribuição condicional de 
3, dado que X = x, é normal com média 


Var(0) 


EJOIX ==] = EO] + 2) varx) 


(x — E[X]) 


=u+—— 4 ) 
ii + 0? e 


e variância 
Var(O|X = x) = Var(O)( — 9?) 
2 
o 


po = 
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7.8.2 A distribuição conjunta da média amostral e da variância amostral 


Sejam X,,..., X, variáveis aleatórias normais independentes, cada uma com mé- 
ey n 

dia wu e variância o”. Suponha que X = 5: X;/n represente a sua média amos- 
i=1 

tral. Como a soma de variáveis aleatórias normais independentes também é 

uma variável aleatória normal, resulta que X é uma variável aleatória normal 

aa é 2 B 
com valor esperado p e variância o“/n (veja os Exemplos 2c e 4a). 
Agora, lembre do Exemplo 4e que 


Cov(X,X;- X)=0, i=1,...,n (8.1) 


Além disso, note que, como X,X, — X,X,— X,...,X, — X são todas combinações 
lineares das variáveis aleatórias normais padrão (X, — u)/o,i = 1,...,n, resulta que 
EA X,— X,i=1,..,n possui uma distribuição conjunta que é normal multivariada. 
Se Y é uma variável aleatória normal com média q e variância on independente 
de X,i=1....,n,então Y,X, — X,i = 1,..,n também possui distribuição multi- 
variada normal e, de fato, por causa da Equação (8.1), possui os mesmos valores 
esperados e covariâncias das variáveis aleatórias XX ST X,i = 1,...,n. Mas, como 
uma distribuição normal multivariada é completamente determinada por seus va- 
lores esperados e covariâncias, resulta que Y,X, — X,i=1,.,neX,X,—- X,i= 
1,...,n possuem a mesma distribuição conjunta. Isso mostra que X é independente 
da sequência de desvios X, — Xl 

Como X é independente da sequência de desvios X, — X,i=1,..,n,ela 


também é independente da variância amostral S? = ã (Xi; — X)P/(n — a 


Como já sabemos que X é normal com média E e dna "In, resta so- 
mente determinar a distribuição de S?, Para fazer isso, lembre-se, do Exemplo 4a, 
da identidade algébrica 


(n — 18º = Seg; — x? 


t=1 


=) un? -nX-w? 


e = : 2 
Dividindo a equação anterior por o”, obtemos 


(n — 1)8º Ten RG e 
o? + (é) E) (82) 


(o, 


f=1 


Agora, 


é a soma dos quadrados de n variáveis aleatórias normais padrão, e com isso 
é uma variável aleatória qui-quadrado com n graus de liberdade. Portanto, 
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do Exemplo 7i, sua função geratriz de momentos é (1 - 21) ”? 


como 

— 2 

ZE de 

o/vn 
é o quadrado de uma variável aleatória normal, ela é uma variável aleatória 
qui-quadrado com 1 grau de liberdade, e portanto possui função geratriz de 
momentos (1 — 2t) 2. Vale notar que vimos anteriormente que as duas variá- 
veis aleatórias no lado esquerdo da Equação (8.2) são independentes. Portanto, 


como a função geratriz da soma de variáveis aleatórias independentes é igual 
ao produto de suas funções geratrizes individuais, temos 


. Além disso, 


Efe'"-DS$/0 q -mM=d-29""º 


ou 


Efe't-DS?/0”] =(1 - 29 -(-D/2 


Mas como (1 - 21) "2 é a função geratriz de momentos de uma variável alea- 
tória qui-quadrado com n — 1 graus de liberdade, podemos concluir, como a 
função geratriz determina unicamente a distribuição da variável aleatória, que 
tal expressão é a distribuição de (n — 1)S'/0º. 

Em resumo, mostramos o seguinte. 


Proposição 8.1 Se X,...., X, são variáveis aleatórias normais independentes 
e identicamente distribuídas com média q e variância o”, então a média amos- 
tral X e a variância amostral Sº são independentes. X é uma variável aleatória 
normal com média q e variância o?/n; (n — 1)S'/o” é uma variável aleatória qui- 
quadrado com n — 1 graus de liberdade. 


7.9 DEFINIÇÃO GERAL DE ESPERANÇA 


Até agora, definimos esperanças apenas para variáveis aleatórias discretas e 
contínuas. Entretanto, existem variáveis aleatórias que não são nem discretas, 
nem contínuas, mas que, ainda assim, podem possuir esperança. Como exem- 
plo de variável aleatória com essas características, vamos supor que X seja 
uma variável aleatória de Bernoulli com parâmetro p = Ê, e que Y seja uma 
variável aleatória uniformemente distribuída no intervalo [0, 1]. Além disso, 
suponhamos que X e Y sejam independentes e definamos a nova variável 
aleatória W como 


X seX=1 
= Y seXz1 
Claramente, W não é nem discreta (já que seu conjunto de valores possíveis, 
[0,1], é incontável), nem contínua (já que P(W = 1) = 5). 
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Para definir a esperança de uma variável aleatória arbitrária, é necessário co- 
nhecer a integral de Stieltjes. Antes de defini-la, vamos lembrar que, para qual- 
quer função g, a integral /. 4 g(x) dx é definida como 


b n 
[ go) dx =lim 3 gol — xp-1) 


a i=1 


onde o limite é assumido em todoa = x, <x,... <x, = b com n5º, e onde 


máx (x; — x;-1)>0. 
flat 


Para qualquer função distribuição F, definimos a integral de Stieltjes da 
função g não negativa no intervalo [a, b] como 


b n 
/ g() dF() = lim S* gaulF Go) — FG] 


A i=1 


onde, como antes, o limite é assumido em todoa = x, <x,...<x, = bcom n50, 


e onde máx (x; — x; 1)—0. Além disso, definimos a integral de Stieltjes ao 
fas ls 


longo de toda a reta real como 


[0.0 b 
F g(x) dF(x) = lim / g(x) dF(x) 


b> + 00 
Finalmente, se g não é uma função não negativa, definimos g' e g” como 
+,» - |80) seg) =0 
80) = I O seg) <0 


O seg(x) >0 


Eus [6 se gl) < 0 


Comog(x)=g' (x)-g (x)eg' eg são ambas funções não negativas, é natural 
definir 


/ g6) dPG) = [ etcodrGo — 8 (9) dF() 


—oo mi 


e dizemos que [“ g(x) dF(x) existe desde que [2 gt) dr()e [E (0) dF (O) 
não sejam ambas iguais a +ºº. 

Se X é uma variável aleatória arbitrária com função distribuição cumulati- 
va F, definimos o valor esperado de X como 


Eu]= f “xdF() (9.1) 


Pode-se mostrar que, se X é uma variável aleatória discreta com função de pro- 
babilidade p(x), então 


f xdF(x) = pia xp(x) 


x:p(x)>0 
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Por outro lado, se X é uma variável aleatória contínua com função densidade 
f(x), então 


f. xdF(x) = f. xf(x) dx 


O leitor deve observar que a Equação (9.1) leva a uma definição intuitiva 
de E[X]; considere a soma aproximada 


DoxilF Go) — FG] 


i=1 


de E[X]. Como F(x,) — F(x,,) é justamente a probabilidade de que X esteja 
no intervalo (x, ,, x,], a soma aproximada multiplica o valor aproximado de X 
quando ele está no intervalo (x, ,,x,| pela probabilidade de que ele esteja nesse 
intervalo e então soma esse valores ao longo de todos os intervalos. Claramen- 
te, como os intervalos se tornam cada vez menores em tamanho, obtemos o 
“valor esperado” de X. 

As integrais de Stieltjes são principalmente de interesse teórico porque re- 
sultam em uma maneira compacta de se definir e de se trabalhar com as proprie- 
dades da esperança. Por exemplo, o uso das integrais de Stieltjes evita a necessi- 
dade de se fornecerem enunciados e demonstrações de teoremas separados para 
os casos contínuos e discretos. Entretanto, suas propriedades são basicamente 
iguais às das integrais ordinárias, e todas as provas apresentadas neste capítulo 
podem ser facilmente traduzidas em demonstrações no caso geral. 


RESUMO 
Se X e Y têm função de probabilidade conjunta p(x, y), então 


Elg(X,W)] = Dust Vp(x,y) 


Por outro lado, se elas têm função densidade conjunta f(x, y), então 
(9,0) [0,6] 
Elg(X,YN)] = / À g(x,y)f (x,y) dx dy 
—00 4 —00 


Uma consequência das equações anteriores é que 
ELX + Y] = ELX] + E[Y] 


que é generalizada para 
n n 
bm Xi | = a E(X;] 
i=t i=1 


A covariância entre as variáveis aleatórias X e Y é dada por 


Cov(X, Y) = EX = EI = ED] = ER] - EMEA 
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Uma identidade útil é 


n m n m 
Cov|5:x,))Y%| =), 5 Covex,Y) 


i=1 0 j= i=1 j=1 


Quandon=me Y,= X,i= 1,...,n,a fórmula anterior resulta em 


n n 
Var [3X] =5 Var(X) + 25:35. Cov(XY) 
i=1 i=1 i<j 
A correlação entre X e Y, escrita como p(X, Y), é definida como 
Cov(X,Y) 
VVar(X) Var(Y) 


Se Xe Ysão variáveis aleatórias conjuntamente discretas, então o valor espera- 
do condicional de X, dado que Y = y, é definido como 


EXIY=y]=> xPtX==Y=)] 


Se Xe Y são variáveis aleatórias conjuntamente contínuas, então 
oo 
E(XIY = y]= / xfx1y Gy) 
—00 


onde 


f(x,y) 
fr0) 


é a função densidade de probabilidade condicional de X dado que Y = y. Espe- 
ranças condicionais, que são similares a esperanças comuns exceto pelo fato de 
agora todas as probabilidades serem calculadas tendo como condição a ocorrên- 
cia do evento Y = y, satisfazem todas a propriedades das esperanças comuns. 

Seja E[X|Y] a função de Y cujo valor em Y = y é E[X|Y = y). Uma identi- 
dade muito útil é 


fxiy GI) = 


E(X] = ELE(X|Y]) 
No caso de variáveis aleatórias discretas, essa equação reduz-se à identidade 


E]=> ElX|Y =y]Pty =) 
y 


e, no caso contínuo, a 


EXI= |" EIP =9]r0) 
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As equações anteriores podem ser muitas vezes aplicadas para se obter E[X] co- 
locando-se algum tipo de “condição” no valor de alguma outra variável aleatória 
Y. Além disso, já que, para qualquer evento 4, P(A) = E[I,), onde 1, é iguala 1 
se À ocorrer e 0 caso contrário, podemos usar as mesmas equações para calcular 
probabilidades. 

A variância condicional de X, dado que Y = y, é definida como 


Var(X|Y = y) = EMX - E(X|Y = y])Y =] 


Seja Var(X|Y) a função de Y cujo valor em Y = y é Var(X|Y = y).A fórmula a 
seguir é conhecida como a variância condicional: 


Var(X) = E[Var(X|Y)] + Var(E[X|Y]) 


Suponha que a variável aleatória X seja observada e, com base em seu valor, O 
valor da variável aleatória Y deva ser predito. Ocorre que, em tal situação, entre 
todos os preditores possíveis, E[Y|X] possui a menor esperança do quadrado da 
diferença com Y. 

A função geratriz de momentos da variável aleatória X é definida como 


M(t) = Efe? 


Os momentos de X podem ser obtidos sucessivamente pelo cálculo das deri- 
vadas de M(t) e em seguida com a avaliação das expressões obtidas em t = 0. 
Especificamente, temos 


d” 
ED] =4MO|  n=1,2,.. 
t=0 


Dois resultados úteis a respeito de funções geratrizes de momentos são, pri- 
meiro, que a função geratriz determina unicamente a função distribuição da 
variável aleatória, e, segundo, que a função geratriz da soma de duas variáveis 
aleatórias independentes é igual ao produto de suas funções geratrizes indi- 
viduais. Esses resultados levam às demonstrações simples de que a soma de 
variáveis aleatórias normais (ou de Poisson, gama) independentes também é 
uma variável aleatória normal (ou de Poisson, gama). 

Se X,,.., X, são combinações lineares de um conjunto finito de variáveis 
aleatórias normais independentes padrão, diz-se que elas possuem distribuição 
normal multivariada. Sua distribuição conjunta é especificada pelos valores de 
EX), Cov(X, X),i,] = 1,..,m. 

Se X,,..., X, são variáveis aleatórias normais independentes e identicamen- 
te distribuídas, então sua média amostral 


dg 
i=1 


e sua variância amostral 


n 


s2 Es > (X; = Xp 


é n-1 
t=1 
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são independentes. A média amostral X é uma variável aleatória normal com 
se sa . ., 2.4 2, 24 : 
média q e variância o7/n; a variável aleatória (n — 1)S“/o” é qui-quadrado com 


n-—1 graus de liberdade. 


PROBLEMAS 


71 Uma apostadora joga simultaneamente 


uma moeda e um dado honestos. Se a 
moeda der cara, ela então ganha o dobro 
do valor que aparecer no dado; se der co- 
roa, ela ganha a metade. Determine seus 
ganhos esperados. 


72 O jogo de Detetive envolve 6 suspeitos, 


6 armas e 9 salas. Um item de cada con- 

junto é sorteado e o objetivo do jogo é 

descobrir quais são esses itens. 

(a) Quantas soluções são possíveis? 
Em uma versão do jogo, faz-se o sorteio 
e então cada um dos jogadores recebe 
aleatoriamente três das cartas restan- 
tes. Sejam S, We R, respectivamente, os 
números de suspeitos, armas e salas no 
conjunto de três cartas distribuídas a 
um jogador específico. Além disso, su- 
ponha que X represente o número de 
soluções possíveis após o jogador ob- 
servar as três cartas que recebeu. 

(b) Escreva X em termos de S, We R. 

(c) Determine E[X]. 


73 Tem-se apostas independentes, cada uma 


delas resultando em uma igual probabili- 
dade de que o apostador ganhe ou perca 
1 unidade. Suponha que W represente o 
ganho líquido de um apostador cuja es- 
tratégia consiste em parar de apostar logo 
após a sua primeira vitória. Determine 
(a) PIW>0) 

(b) PIW<0)] 

(e) EIW] 


74 Se Xe Y têm função densidade conjunta 


-J1/y se0O<y<1, 0O<x<y 
fe ya) = | O, caso contrário 
determine: 
(a) ELXY] 
(b) E[X] 
(c) E[Y] 


75 O hospital municipal está localizado no 


centro de um quadrado cujos lados têm 


T6 


77 


78 


79 


3 km de extensão. Se um acidente ocorrer 
no interior desse quadrado, então o hos- 
pital envia uma ambulância. A disposição 
das ruas é retangular, então a distância de 
viagem do hospital, que está nas coorde- 
nadas (0,0), ao ponto (x,y) é |x| + |y!. Se 
um acidente ocorre em um ponto unifor- 
memente distribuído no interior do qua- 
drado, determine a distância de viagem 
esperada da ambulância. 
Um dado honesto é rolado 10 vezes. Cal- 
cule a soma esperada das 10 jogadas. 
Suponha que 4 e B escolham aleatória 
e independentemente 3 objetos em um 
conjunto de 10. Determine o número es- 
perado de objetos; 
(a) escolhidos simultaneamente por 4 e B; 
(b) não escolhidos nem por 4, nem por B; 
(c) escolhidos por exatamente um de A 
e B. 
N pessoas chegam separadamente em 
um jantar de negócios. Ao chegar, cada 
pessoa olha para ver se tem amigos entre 
aqueles presentes. Aquela pessoa então 
se senta ou na mesa de um amigo, ou em 
uma mesa desocupada caso nenhuma das 
pessoas presentes seja seu amigo. Supon- 


do que cada um dos ( o pares de pes- 


soas seja, independentemente, um par de 
amigos com probabilidade p, determine o 
número esperado de mesas ocupadas. 
Dica: Considere X, igual a 1 ou 0, depen- 
dendo da i-ésima pessoa sentar-se ou não 
em uma mesa desocupada. 
Um total de n bolas numeradas de 1 an é 
colocado em n urnas (também numeradas 
de 1 an) de forma tal que a bola i tenha 
igual probabilidade de ir para qualquer 
urna 1,2,..., i. Determine: 
(a) o número esperado de urnas vazias; 
(b) a probabilidade de que nenhuma das 
urnas esteja vazia. 


7.10 Considere 3 tentativas com mesma pro- 


babilidade de sucesso. Suponha que X 
represente o número total de sucessos 
nessas tentativas. Se E[X] = 1,8, qual é 
(a) o maior valor possível de P(X = 3)? 
(b) o menor valor possível de P|X = 3)? 
Em ambos os casos, construa um cenário 
de probabilidades que resulte em P(X = 3) 
possuir o valor declarado. 

Dica: Para a letra (b), você deve começar 
fazendo com que U seja uma variável alea- 
tória uniforme em (0,1) e depois definindo 
as tentativas em termos do valor de U. 


711 Considere n jogadas independentes de 


uma moeda com probabilidade p de dar 
cara. Digamos que uma inversão ocorra 
sempre que um resultado difira daquele 
que o precede. Por exemplo, sen = 5 e 
o resultado é HHTHT(sendo H cara e T 
coroa), então há 3 inversões. Determine o 
valor esperado de inversões. 

Dica: Expresse o número de inversões 
como a soma de n — 1 variáveis aleatórias 
de Bernoulli. 


712 Alinha-se aleatoriamente um grupo de n 


homens e n mulheres. 

(a) Determine o número esperado de ho- 
mens que têm uma mulher ao seu lado. 

(b) Repita a letra (a), mas agora supondo 
que o grupo esteja sentado aleatoria- 
mente em uma mesa redonda. 


713 Um conjunto de 1000 cartas numeradas 


de 1 a 1000 é distribuído aleatoriamente 
entre 1000 pessoas, com cada uma delas 
recebendo uma carta. Calcule o número 
esperado de pessoas cuja idade é igual ao 
número marcado na carta que recebeu. 


714 Uma urna tem m bolas pretas. Em cada 


rodada, uma bola preta é retirada e uma 
nova bola é colocada em seu lugar. A 
bola colocada na urna tem probabilida- 
de p de ser preta e 1 —- p de ser branca. 
Determine o número de rodadas neces- 
sárias até que não existam mais bolas 
pretas na urna. 

Nota: Este experimento tem muitas aplica- 
ções possíveis na pesquisa da AIDS. Parte 
do sistema imunológico de nosso organis- 
mo consiste em certa classe de células co- 
nhecidas como células T. Há 2 tipos de cé- 
lulas T, chamadas de CD4 e CD8. Embora 
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o número total de células T em portadores 
do vírus da AIDS seja igual (pelo menos 
nos estágios iniciais da doença) ao número 
presente em indivíduos sadios, descobriu-se 
recentemente que a proporção de células T 
CD4 e CD3 é diferente nas pessoas sadias 
e naquelas portadoras do vírus: aproxima- 
damente 60% das células T de uma pessoa 
sadia são do tipo CD4, enquanto o percen- 
tual de células T do tipo CD4 parece de- 
crescer continuamente em portadores do 
vírus da AIDS. Um modelo recente propõe 
que o vírus HIV (que causa a AIDS) ata- 
ca as células CD4, e que o mecanismo do 
organismo para repor as células T mortas 
não consegue identificar se a célula morta 
era CD4 ou CDB8. Em vez disso, ela produz 
uma nova célula T cujas probabilidades de 
ser dos tipos CD4 e CD8 são de 0,6 e 0,4, 
respectivamente. Entretanto, embora isso 
pareça ser uma maneira muito eficiente de 
se repor as células T quando cada célula 
morta tem a mesma probabilidade de ser 
de qualquer tipo (e, portanto, tem proba- 
bilidade de 0,6 de ser CD4), as consequên- 
cias são perigosas ao se tratar de um vírus 
que ataca somente as células CDA. 


715 No Exemplo 2h, considere que i e j, i =), 


formem um pareamento se i escolher 
o chapéu que pertence a j e vice-versa. 
Determine o número esperado de parea- 
mentos. 


7.16 Seja Z uma variável aleatória normal e, 


para um x fixo, considere 


lo seZ > x 
X= A 
O caso contrário 


—x2/2 


Mostre que E[X] = e 


1 
v2a 


717 Um baralho com n cartas numeradas de 1 


a n é embaralhado de forma que todas as 
n! ordenações de cartas possíveis sejam 
igualmente prováveis. Suponha que você 
faça n palpites sucessivos, onde o i-ésimo 
palpite diz que a carta desejada está na 
posição i. Chame de N o número de palpi- 
tes corretos. 

(a) Se você não recebe informações sobre 
seus palpites anteriores, mostre que, 
para qualquer estratégia, E[N] = 1. 

(b) Suponha que, após cada palpite, a 
carta na posição em questão seja mos- 


trada para você. Qual estratégia você 
considera a melhor? Mostre que, com 
essa estratégia, 


1 1 
EIN] = — + AT 


"1 
el -d =1 
A z X ogn 


Suponha que lhe digam após cada 
palpite se você estava certo ou errado. 
Neste caso, pode-se mostrar que a es- 
tratégia que maximiza E[N] é aquela 
em que você continua a fazer sempre 
o mesmo palpite, escolhendo a mesma 
carta até acertá-la e mudando depois 
para uma nova carta. Para essa estra- 
tégia, mostre que 


fes 


(e) 


E 1 
EN=I+t5tytoe+s 


xe-l 


Dica: Em todas as letras, expresse N como 
a soma das variáveis aleatórias indicado- 
ras (isto é, de Bernoulli). 


719 Certa região é habitada por r tipos distin- 


tos de certa espécie de inseto. Cada inseto 
capturado será, independentemente dos 
tipos capturados anteriormente, do tipo i 
com probabilidade 


r 
PSA aro DR 
1 


(a) Calcule o número médio de insetos 
capturados antes da captura de um 
inseto do tipo 1. 

(b) Calcule o número médio de tipos de 
insetos que são capturados antes da 
captura de um inseto do tipo i. 


7.20 Em uma urna contendo n bolas, a i-ésima 


bola tem peso W(i), i = 1,...,n. As bolas 
são removidas sem substituição, uma de 
cada vez, de acordo com a regra a seguir: 
em cada seleção, a probabilidade de que 
uma bola seja escolhida é igual ao seu 
peso dividido pela soma dos demais pesos 
na urna. Por exemplo, se em algum instan- 
te i,,..., i, for o conjunto de bolas remanes- 
centes na urna, então a próxima seleção 


será i com probabilidade W(i,) / = Wíiy 


j=...,r. Calcule o número esperado de 
bolas retiradas antes da bola 1. 
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721 


722 


723 


724 


725 


Para um grupo de 100 pessoas, compute 
(a) o número esperado de dias do ano 
que são aniversários de pelo menos 3 
pessoas; 
(b) o número esperado de datas de ani- 
versário distintas. 
Quantas vezes você espera rolar um dado 
honesto até que todos os 6 lados tenham 
aparecido pelo menos uma vez? 
A urna 1 contém 5 bolas brancas e 6 bolas 
pretas, enquanto a urna 2 contém 8 bolas 
brancas e 10 bolas pretas. Duas bolas são 
selecionadas aleatoriamente da urna 1 e 
colocadas na urna 2. Se 3 bolas são então 
sorteadas da urna 2, calcule o número de 
bolas brancas no trio. 
Dica: Faça X, = 1 se a i-ésima bola branca 
inicialmente na urna 1 for uma das três 
bolas selecionadas, e X, = O caso contrá- 
rio. Similarmente, faça Y, = 1 se a i-ésima 
bola branca da urna 2 for uma das três se- 
lecionadas, e Y, = 0 caso contrário. O nú- 


mero de bolas brancas no trio pode agora 
5 8 


ser escrito como >, Xi; + 3. Yi. 
1 1 


Uma garrafa contém inicialmente m pí- 

lulas grandes e n pílulas pequenas. Cada 

dia, um paciente escolhe uma das pílulas 
aleatoriamente. Se uma pílula pequena 

é escolhida, ela é então partida ao meio; 

um dos pedaços é devolvido à garrafa, 

passando a ser considerado uma pílula 
pequena, e o outro é consumido. 

(a) Seja X o número de pílulas pequenas na 
garrafa após a escolha da última pílula 
grande e da devolução de uma parte 
dela para a garrafa. Determine E[X]. 

Dica: Defina n + m variáveis indicadoras, 

uma para cada uma das pílulas pequenas 

inicialmente presentes e uma para cada 
uma das m pílulas pequenas criadas com 

a divisão das pílulas grandes. Use agora o 

argumento do Exemplo 2m. 

(b) Seja Y o dia em que a última pílula 
grande é escolhida. Determine E[Y]. 

Dica: Qual é a relação entre X e Y? 

Seja X,, X,,... uma sequência de variáveis 

aleatórias contínuas independentes e 

identicamente distribuídas. Considere N 

= 2 tal que 


MEM EM; 
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Isto é, N é o ponto no qual a sequência 

para de decrescer. Mostre que E[N] = e. 
726 Se X,, X,,..., X, são variáveis aleatórias 

independentes e identicamente distri- 

buídas com distribuições uniformes em 

(0,1), determine 

(a) Elmáx(X ,...., X,)]: 

(b) Elmin(X,...., X)]. 

*7,27 Se 101 itens são distribuídos entre 10 cai- 
xas, então pelo menos uma das caixas deve 
conter mais de 10 itens. Use o método pro- 
babilístico para provar esse resultado. 

*728 O sistema circular de confiabilidade X- 
de-r-em-n, com k = r < n, consiste em 
n componentes que são arranjados em 
disposição circular. Cada componente ou 
funciona, ou falha, e o sistema funciona se 
não houver blocos de r componentes con- 
secutivos dos quais pelo menos k sejam 
defeituosos. Mostre que não há maneira 
de arranjar 47 componentes, 8 dos quais 
defeituosos, para criar um sistema circu- 
lar 3-de-12-em-47 que funcione. 

*7,29 Existem 4 tipos diferentes de cupons de 
desconto. Destes, 2 compõem um grupo e 
os outros 2 compõem outro grupo. Cada 
novo cupom obtido é do tipo i com proba- 
bilidade p, onde p,=p,=1/8, p;=D,=3/8. 
Determine o número esperado de cupons 
necessários para que se obtenham pelo 
menos 
(a) todos os 4 tipos; 

(b) todos os tipos do primeiro grupo; 
(c) todos os tipos do segundo grupo; 
(d) todos os tipos de cada grupo. 

730 Se X e Y são independentes e identica- 
mente distribuídos com média q e variân- 
cia o, determine 


EX 9] 


731 No Problema 7.6, calcule a variância da 
soma das jogadas. 

732 No Problema 79, calcule a variância do 
número de urnas vazias. 

732 Se E[X] = 1 e Var(X) = 5, determine 
(a) EI + X)); 
(b) Var(4 + 3X). 

734 Se 10 casais se sentam em uma mesa redon- 
da, compute (a) o número esperado e (b) 
a variância do número de esposas que se 
sentam ao lado de seus maridos. 


7.35 Cartas de um baralho comum são viradas 
uma de cada vez. Compute o número es- 
perado de cartas que precisam ser viradas 
até que se obtenham 
(a) 2 ases; 

(b) 5 espadas; 
(c) todos as treze cartas de copas. 

736 Seja X o número de 1'se Y o número de 
2's que ocorrem em n jogadas de um dado 
honesto. Compute Cov(X, Y). 

737 Um dado é rolado duas vezes. Suponha 
que X seja igual à soma dos resultados 
e que Y seja igual ao primeiro resultado 
menos o segundo. Compute Cov(X, Y). 

738 As variáveis aleatórias X e Y têm uma 
função densidade conjunta dada por 


“Je Xp 0<x<o0sy=<r 
Pa gh= 0 caso contrário 


Compute Cov(X, Y). 

7.39 Sejam as variáveis aleatórias X,,... inde- 
pendentes com mesma média e variân- 
ciao,efaçaY, =X, +X,. + X,., Para 
j=0, determine Cov(Y,, Y,.,;). 

740 A função densidade conjunta de Xe Y é 
dada por 


e Ota), 


fw,y) = x>0,y>0 


1 

y 
Determine E[X], E[Y] e mostre que 
Cov(X,Y) = 1. 

741 Um lago contém 100 peixes, dos quais 
30 são carpas. Se 20 peixes são pescados, 
qual é a média e a variância no número 
de carpas entre esses 20? Que hipóteses 
você está adotando? 

742 Um grupo de 20 pessoas formado por 
10 homens e 10 mulheres é arranjado 
aleatoriamente em 10 pares. Calcule a 
esperança e a variância do número de 
pares formados por um homem e uma 
mulher. Suponha agora que as 20 pes- 
soas consistam em 10 casais. Calcule a 
média e a variância do número de casais 
que formam pares. 

743 Sejam X,, X,,..., X, variáveis aleatórias 
independentes com função distribuição 
contínua desconhecida F,e Y,, Y5,..., Y, 

variáveis aleatórias independentes com 

função distribuição contínua desconheci- 


da G. Agora ordene essas n + m variáveis 
e considere 


1 seai-ésima menor dasn +m 
= variáveis pertence à amostra X 
O caso contrário 


m 

A variável aleatória R = s il; é a soma 

i=1 
das ordens da amostra X e é a base de um 
procedimento estatístico (chamado de 
teste da soma das ordens de Wilcoxon) 
empregado para testar se Fe G são distri- 
buições idênticas. Esse teste aceita a hipó- 
tese de F = G quando R não é nem muito 
grande, nem muito pequeno. Supondo que 
a hipótese de igualdade seja de fato corre- 
ta, calcule a média e a variância de R. 
Dica: Use os resultados do Exemplo 3e. 


7.44 Entre dois métodos distintos de fabrica- 


ção de certos produtos, a qualidade dos 
produtos fabricados pelo método i é uma 
variável aleatória com distribuição F,i = 
1,2. Suponha que n produtos sejam pro- 
duzidos pelo método 1, e m, pelo método 
2. Ordene os n + m produtos de acordo 
com a sua qualidade e considere 


1 seoj-ésimo melhor produto 


X;= foi fabricado com o método 1 


2 caso contrário 


Para o vetor X,, X,,..., X,,m que consiste 
emn 1º'sem 2's, suponha que R represente 
o número de séries de 1º's. Por exemplo, se 
n=5m=2eX=1,2,1,1,1,1,2,então R 
=2.Se F, = F, (isto é, se os dois métodos 
fabricam produtos identicamente distribuí- 


dos), qual é a média e a variância de R? 


745 Se X,, X,, X,e X, são variáveis aleatórias 


não correlacionadas (por pares), cada 
uma com média O e variância 1, calcule as 
correlações de 

(0) NA +LEeX,+ X; 

(Db) A+ CX, + X, 


746 Considere o seguinte jogo de dados: os 


jogadores 1 e 2 rolam um par de dados 
alternadamente. A banca então rola os 
dados para determinar o resultado de 
acordo com a seguinte regra: o jogador i, 
i = 1,2, vence se a sua jogada for estrita- 
mente maior do que a da banca. Para i = 
1,2, considere 
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fi= 1 seivencer 
'" 10 caso contrário 


e mostre que 7, e 1, são positivamente 
correlacionadas. Explique por que esse 
resultado já era esperado. 


747 Considere um grafo com n vértices nume- 


rados de 1 a n e suponha que, entre cada 
um dos (2) pares de vértices distintos, uma 


borda esteja presente com probabilidade 

p. O grau do vértice i, designado como D,, 

corresponde ao número de bordas que tem 

o vértice i como um de seus vértices. 

(a) Qual é a distribuição de D? 

(b) Determine p(D,, D), a correlação en- 
tre D;e D, 


748 Um dado honesto é jogado sucessiva- 


mente. Suponha que X e Y representem, 
respectivamente, o número de jogadas 
necessárias para se obter um 6 e um 5. 
Determine 


(a) EX); 
(b) ELXIY = 1); 
(o) ELXIY = 5]; 


7,49 Há duas moedas deformadas em uma 


caixa; suas probabilidades de dar cara 
quando jogadas são, respectivamente, de 
0,4 e 0,7 Uma das moedas é escolhida ale- 
atoriamente e jogada 10 vezes. Dado que 
duas das primeiras três jogadas tenham 
dado cara, qual é o número esperado con- 
dicional de caras nas 10 jogadas? 


750 A função densidade conjunta de X e Y é 


dada por 
eres 
fe)="——— 0O<x<o, 0<y<o 


Calcule E[X|Y = 3]. 


751 A função densidade de Xe Y é dada por 


= 
fap=, 0O<x<y 0O<y<o 
y 


Calcule E[X"|Y = y]. 


7.52 Uma população é formada por r subgru- 


pos disjuntos. Suponha que p, represente 
a proporção da população que está no 
subgrupo i, i = 1,...,r.Se o peso médio dos 
membros do subgrupo i é w,i = 1,...,r, 
qual é o peso médio dos membros da po- 
pulação? 


753 Um prisioneiro está em uma cela com 3 


portas. A primeira porta leva a um túnel 
que faz com que ele volte à sua cela após 
dois dias de viagem. A segunda leva a um 
túnel que faz com que ele volte à sua cela 
após 4 dias de viagem. A terceira porta o 
leva à liberdade após um dia de viagem. 
Se se supõe que o prisioneiro sempre sele- 
cione as portas 1,2 e 3 com probabilidades 
0,5,0,3 e 0,2, qual é o número esperado de 
dias até que ele alcance a liberdade? 


754 Considere o seguinte jogo de dados: um 


par de dados é rolado. Se a soma dá 7 então 
o jogo termina e você não ganha nada. Se a 
soma não dá 7 então você tem a opção de 
parar o jogo e receber uma quantia igual 
àquela soma ou de começar novamente. 
Para cada valor de i, i = 2,..., 12, determine 
o lucro esperado se você empregar a estra- 
tégia de parar na primeira vez que aparecer 
um valor pelo menos igual a i. Que valor de 
i leva ao maior retorno esperado? 

Dica: Suponha que X, represente o lucro 
quando você usa o valor crítico i. Para cal- 
cular E[X,], condicione na soma inicial. 


7.55 Dez caçadores esperam uma revoada de 


patos. Quando um bando de patos passa 
voando, os caçadores atiram ao mesmo 
tempo, com cada um escolhendo o seu 
alvo aleatoriamente, independentemente 
dos demais. Se cada caçador atinge seu 
alvo independentemente com probabili- 
dade de 0,6, calcule o número esperado 
de patos atingidos. Suponha que o núme- 
ro de patos em um bando seja uma variá- 
vel aleatória de Poisson com média 6. 


7.56 O número de pessoas que entra em um 


elevador no andar térreo é uma variável 
de Poisson com média 10. Se existem N 
andares acima do térreo e se cada pessoa 
tem a mesma probabilidade de descer em 
cada um dos andares, independentemen- 
te de onde descem as demais, compute o 
número esperado de paradas que o ele- 
vador fará antes de descarregar todos os 
seus passageiros. 


7.57 Suponha que o número esperado de 


acidentes por semana em uma fábrica 
seja igual a 5. Suponha também que os 
números de trabalhadores feridos em 
cada acidente sejam variáveis aleatórias 
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independentes com média 2,5. Se o nú- 
mero de trabalhadores feridos em cada 
acidente é independente do número de 
acidentes ocorridos, compute o número 
esperado de trabalhadores feridos em 
uma semana. 


7.58 Uma moeda com probabilidade p de dar 


cara é jogada continuamente até que dê 

cara e coroa. Determine 

(a) o número esperado de jogadas; 

(b) a probabilidade de que a última joga- 
da dê cara. 


759 Um jogo tem n + 1 participantes. Cada 


um deles tem probabilidade p de ser a 
vencedor. Os vencedores dividem um 
prêmio total de 1 unidade (por exemplo, 
se 4 pessoas vencerem o jogo, então cada 
uma delas receberá À, por outro lado, se 
não houver vencedores, ninguém leva 
nada). Suponha que 4 represente um dos 
jogadores e faça com que X represente a 
quantia por ele recebida. 

(a) Compute o prêmio total esperado 

compartilhado pelos participantes. 


sm a n+1 
(b) Mostre que E[X] = Ee 


(c) Calcule E[X] condicionando em A ser 
ou não um dos vencedores, e conclua 
que 


1-(1- prt 


Ha += as Dz 


quando B é uma variável aleatória bi- 
nomial com parâmetros n e p. 


7,60 Cada um de m + 2 jogadores deposita 1 


unidade em uma caixinha com o intuito 
de jogar o seguinte jogo: uma moeda ho- 
nesta é jogada sucessivamente n vezes, 
onde n é um número ímpar, e os resulta- 
dos obtidos são anotados. Antes das n jo- 
gadas, cada jogador escreve o seu palpite. 
Por exemplo, se n = 3, então um jogador 
pode escrever (H, H, T), 0 que quer dizer 
que ele acha que as duas primeiras joga- 
das vão dar cara (H) e a terceira jogada 
vai dar coroa (T). Após as jogadas, o jo- 
gador conta o número total de palpites 
corretos. Assim, se saírem 3 caras, o joga- 
dor que escreveu (H, H, T) terá 2 palpites 
corretos. A caixinha com os depósitos de 
todos os m + 2 jogadores é então dividi- 


da igualmente entre os jogadores com o 

maior número de palpites certos. 

Como cada uma das jogadas tem 

a mesma probabilidade de dar cara ou 

coroa, m dos jogadores decidiram fazer 

seus palpites de maneira completamente 
aleatória. Especificamente, eles vão jogar 
uma de suas próprias moedas honestas 

n vezes e então usar o resultado obtido 

como palpite. Entretanto, os 2 últimos jo- 

gadores formaram uma sociedade e utili- 
zarão a seguinte estratégia: um deles fará 
seus palpites da mesma maneira aleatória 
que os demais jogadores, mas o outro fará 
uma aposta exatamente oposta à do pri- 

meiro. Isto é, se um deles apostar cara, o 

outro apostará coroa. Por exemplo, se o 

palpite de um for (H, H, T),o palpite do 

outro será (7, T, H). 

(a) Mostre que exatamente um dos mem- 
bros da sociedade terá mais de n/2 pal- 
pites corretos (lembre que n é ímpar). 

(b) Suponha que X represente quantos 
dos m jogadores não participantes da 
sociedade terão mais de n/2 palpites 
corretos. Qual é a distribuição de X? 

(c) Com X definido como na letra (b), 
mostre que 


Ellucro da sociedade] = (m + 2) 


1 
x 
Ely 


(d) Use a letra (c) do Problema 59 para 
concluir que 


Zm + 2) 
m+1 


1 m+41 
x1- (5 
:-(5) 
e calcule explicitamente este número 


quando m = 1,2,e 3. Como é possível 
mostrar que 


2 m+l 
(m + 2) 1 1 -2 
m+1 2 
tem-se que a estratégia da sociedade 
sempre leva a um lucro esperado po- 
sitivo. 


761 Sejam X,,...variáveis aleatórias indepen- 
dentes com mesma função distribuição F, e 


Ellucro da sociedade] = 
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suponha que elas sejam independentes de 

N, uma variável aleatória geométrica com 

parâmetro p. Seja M = máx(X,,..., Xy). 

(a) Determine P(M = x] condicionando 
em N. 

(b) Determine P(M <= x|N = 1) 

(c) Determine PIM =x|N>1) 

(d) Use (b) e (c) para deduzir novamente 
a probabilidade que você obteve na 
letra (a). 

7.62 Seja U,, U,,.. uma sequência de variáveis 
aleatórias uniformes no intervalo (0, 1). 
No Exemplo 5i, mostramos que, para O = 
x <1, E[N(O)] = é, onde 


voo om fes > + 


i=1 


O presente problema fornece um outra 
abordagem para se obter esse resultado. 
(a) Mostre por indução em n que, para O 
<x=<letodon=>0, 
x" 


P(N(G) =n + 1) al 


Dica: Primeiro condicione em U, e 
depois use a hipótese de indução. 
Use a letra (a) para concluir que 


EING)] = é 


763 Uma urna contém 30 bolas, das quais 10 
são vermelhas e 8 são azuis. Doze bolas 
são sorteadas dessa urna. Suponha que X 
represente o número de bolas vermelhas, 
e Y, o número de bolas azuis sorteadas. 
Determine Cov(X, Y) 
(a) definindo variáveis indicadoras (isto 

é, de Bernoulli) apropriadas 


10 8 
XiYjtaisque X=5 X,Y=50) 
i=i j=1 


(b) condicionando (em X ou Y) para de- 
terminar E(XY). 

7.64 Lâmpadas do tipo i funcionam uma quan- 
tidade de tempo aleatória com média q, e 
desvio padrão o, i = 1,2. Uma lâmpada 
aleatoriamente escolhida de uma cesta é 
do tipo 1 com probabilidade p e do tipo 2 
com probabilidade 1 — p. Suponha que X 
represente o tempo de vida desta lâmpa- 
da. Determine 
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(a) E[X]; 
(b) Var(X). 

7.65 O número de tempestades de inverno em 
um ano bom é uma variável aleatória de 
Poisson com média 3, enquanto o número 
em um ano ruim é uma variável de Pois- 
son com média 5. Se o próximo ano tem 
probabilidades 0,4 de ser um ano bom e 
0,6 de ser um ano ruim, determine o valor 
esperado e a variância do número de tem- 
pestades no próximo ano. 

7.66 No Exemplo 5c, calcule a variância do tem- 
po gasto até que um minerador se salve. 

767 Considere um jogador que, em cada apos- 
ta, ganhe ou perca com respectivas proba- 
bilidades p e 1 — p. Um popular sistema 
de apostas é conhecido como estratégia 
de Kelley. Esta consiste no jogador sem- 
pre apostar a fração 2p — 1 de sua riqueza 
quando p > 3. Calcule a riqueza esperada 
após n apostas de um jogador que come- 
ça com x unidades e emprega a estratégia 
de Kelley. 

7.68 O número de acidentes que uma pessoa 
sofre em um ano é uma variável aleató- 
ria de Poisson com média À. Entretanto, 
suponha que o valor de À mude de pes- 
soa para pessoa, sendo igual a 2 em 60% 
da população e 3 nos 40% restantes. Se 
uma pessoa é escolhida aleatoriamente, 
qual é a probabilidade de que ela sofra 
(a) O acidentes e (b) exatamente 3 aciden- 
tes em um ano? Qual é a probabilidade 
condicional de que ela sofra 3 acidentes 
em certo ano, dado que não tenha sofrido 
acidentes no ano anterior? 

7.69 Repita o Problema 768 quando a propor- 
ção da população com valor de À menor 
que x éiguala 1 - e”. 

770 Considere uma urna contendo um grande 
número de moedas e suponha que cada 
uma das moedas tenha alguma probabi- 
lidade p de dar cara quando jogada. En- 
tretanto, o valor de p varia de moeda para 
moeda. Suponha que a composição da 
urna seja tal que, se uma moeda for sele- 
cionada aleatoriamente a partir dela, então 
o valor de p correspondente àquela moeda 
possa ser tratado como sendo uma variável 
aleatória uniformemente distribuída no in- 
tervalo [0, 1]. Se uma moeda é selecionada 


aleatoriamente da urna e jogada duas ve- 

zes, calcule a probabilidade de que 

(a) a primeira jogada resulte em cara. 

(b) as duas jogadas resultem em cara. 
7.71 No Problema 770, suponha que a moeda 

seja jogada n vezes e que X represente o 

número de caras que aparecem. Mostre 

que 


P= = i=0,1,...,n 


+1 


Dica: Utilize o fato que 


1 
di eu (= Dib — 1)! 
À x" dr= Ga Dar FF» DI 


onde a e b são inteiros positivos. 

7.22 Suponha que, no Problema 7,70, conti- 
nuemos a jogar a moeda até que dê cara. 
Seja N o número necessário de jogadas. 
Determine 
(a) PN zi),izo; 

(b) PIN = i); 
(c) EIN]. 

7.73 No Exemplo 6b, suponha que S represen- 
te o sinal enviado e R,o sinal recebido. 
(a) Calcule E[R]; 

(b) Calcule Var(R); 
(c) R é normalmente distribuída? 
(d) Calcule Cov(R,S). 

7.74 No Exemplo 6c, suponha que X seja uma 
variável aleatória uniformemente distri- 
buída no intervalo (0, 1). Se as regiões 
discretizadas são determinadas por a, = 
0,4, =3ea,= 1,calcule o quantizador 
ótimo Y e determine E[(X — Y). 

7,75 A função geratriz de momentos de X é 
dada por My(t) = exp2e - 2], eade Y 
por Mt) = (Ge + 1)1º.Se Xe Y são in- 
dependentes, determine 
(a) PX+Y=2] 

(b) PLXY = 0 
(co) ELXY]? 

7.76 Seja X o valor do primeiro dado e Y a 
soma dos valores quando dois dados são 
jogados. Calcule a função geratriz de mo- 
mentos conjunta de X e Y. 

777 A densidade conjunta de X e Y é dada por 


ee 


O <y< o, 


fer) = 
Bv a 


—00 < X < 00 


(a) Calcule a função geratriz de momen- 
tos conjunta de X e Y. 

(b) Calcule as funções geratrizes de mo- 
mentos individuais. 

7.78 Dois envelopes, cada um contendo um 
cheque, são colocados à sua frente. Você 
deve escolher um dos envelopes, abri-lo 
e ver o valor do cheque. Neste momento, 
você pode ficar com esse cheque ou trocá- 
lo pelo outro no envelope fechado. O que 
você faria? É possível traçar uma estraté- 
gia que seja melhor do que simplesmente 
aceitar o primeiro cheque? 

Suponha que 4 e B,A4 < B, sejam as 
quantias (desconhecidas) dos cheques, 
e observe que a estratégia de selecionar 
aleatoriamente um dos envelopes e sem- 
pre ficar com o primeiro cheque tem um 
retorno esperado de (A + B)/2. Consi- 
dere a seguinte estratégia: suponha que 
F(:) seja qualquer função distribuição 
contínua estritamente crescente. Escolha 
um envelope aleatoriamente e abra-o. Se 
o cheque em seu interior tiver o valor x, 
então aceite-o com probabilidade F(x) ou 
troque-o com probabilidade 1 — F(x). 
(a) Mostre que se você empregar esta 
estratégia, seu retorno esperado será 
superior a (A + B)/2. 
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Dica: Condicione na possibilidade do 
primeiro envelope ter o valor 4 ou B. 
Considere agora uma estratégia em 
que se fixe um valor x e se aceite o 
primeiro cheque caso o seu valor seja 
maior que x. 

(b) Mostre que, para qualquer x, o re- 
torno esperado de acordo com essa 
estratégia é no mínimo igual a (A + 
B)/2 e estritamente maior que (A + 
B)/2 se x estiver entre A e B. 

(c) Suponha que X seja uma variável 
aleatória contínua em todo O eixo 
real, e considere a seguinte estratégia: 
gere o valor de Xe, se X = x, empre- 
gue a estratégia da letra (b). Mostre 
que o retorno esperado com essa es- 
tratégia é maior que (A + B)/2. 

7.79 Vendas semanais sucessivas, em unidades 
de milhares de reais, possuem uma distri- 
buição normal bivariada com média 40, 
desvio padrão 6 e correlação 0,6. 

(a) Determine a probabilidade de que o 
total de vendas das próximas duas se- 
manas seja superior a 90. 

(b) Se a correlação fosse de 0,2 em vez 
de 0,6, isso aumentara ou diminuiria 
a resposta da letra (a)? 

(c) Repita a letra (a) para uma correlação 
de 0,2. 


EXERCÍCIOS TEÓRICOS 


71 Mostre que a esperança E[(X - a)”] é ma- 
ximizada quando a = E[X]. 

72 Suponha que X seja uma variável alea- 
tória contínua com função densidade f. 
Mostre que E[|X — al] é minimizada quan- 
do a é igual à mediana de F. 

Dica: Escreva 


E[IX — al] - ft — alf(x) dx 


Agora divida a integral nas regiões em 
quex<aex>ae calcule as derivadas. 
73 Demonstre a Proposição 2.1 quando 

(a) Xe Y possuem função de probabili- 
dade conjunta; 

(b) Xe Y possuem função densidade de 
probabilidade conjunta e g(x,y) > 0 
para todo x, . 


74 Suponha que X seja uma variável alea- 
tória com esperança finita q e variância 
o”, e que g(:) seja uma função que possui 
derivada segunda. Mostre que 


Elg00] = gu) + EO? 
Dica: Expanda g(:) em uma série de 
Taylor em torno de q. Use os três primei- 
ros termos e ignore o resíduo. 
75 Sejam 4,, À,...., A, eventos arbitrários e 
defina C, = [ocorrem pelo menos k de 
A). Mostre que 


> PCCO = Pam 
k=1 k=1 


Dica: Suponha que X represente o nú- 
mero de A;s ocorridos. Mostre que am- 
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bos os lados da equação anterior são 
iguais a E[X]. 
76 No texto, notamos que 


onde X, são variáveis aleatórias não nega- 
tivas. Como uma integral é um limite de 
somas, pode-se esperar que 


E [xa] = | etxona 
0 0 


sempre que as variáveis aleatórias X(1t), 
0=t<00,forem não negativas; e este re- 
sultado é realmente verdadeiro. Utilize-o 
para dar outra demonstração para o re- 
sultado que mostra que, para uma variá- 
vel aleatória não negativa X, 


ELO = [" PIX > t) dt 
0 


Dica: Defina, para cada t não negativo, a 
variável aleatória X(t) como 


1 set<xX 
xo = setzx 


Agora relacione 5º X(t)di a X. 

77 Dizemos que X é estocasticamente maior 
que Y, o que se escreve X =, Y, se, para 
todo t, 

PiX>yzPY>S 


Mostre que, se X =, Y, então E[X] = 


ElY] quando 

(a) Xe Y forem variáveis aleatórias não 
negativas; 

(b) Xe Y forem variáveis aleatórias arbi- 
trárias. 

Dica: Escreva X como 

K=M0=X= 
onde 


X se XxX =>0 O se X =0 
Eras — — 
pel nar (a O 


Similarmente, represente Y como Y* — 
Y. Então utilize a letra (a). 


78 Mostre que X é estocasticamente maior 
que Y se e somente se 


EVCO] = EO] 


para todas as funções crescentes f. 

Dica: Mostre que X =, Y, depois E[f(X)] 
= EIf(Y)] mostrando que f(X) =, AY), 
e então usando o Exercício Teórico 77. 
Para mostrar que P(X > 1] > P|Y > t) se 
EWOO] = ELf(Y)] para todas as funções 
crescentes f, defina uma função crescente 
fapropriada. 

7.9 Uma moeda com probabilidade p de dar 
cara é jogada n vezes. Calcule o número 
esperado de séries de caras com tamanho 
12ekl<=k=n. 

710 Sejam X,, X,...., X, variáveis aleatórias 
positivas independentes e identicamente 
distribuídas. Para k = n, determine 


k 
Di 
i=1 

n 
5x 
i=1 


E 


711 Considere n tentativas independentes, 
cada uma levando a um dos r resultados 
possíveis com probabilidades P,, P,,..., P,. 
Suponha que X represente o número de 
resultados que nunca ocorrem em qual- 
quer uma da tentativas. Determine E[X] 
e mostre que, entre todos os vetores pro- 
babilidade P,,..., P,, E[X] é minimizada 
quando P, = 1/r,i= 1,...,r. 

712 Seja X,, X,,... uma sequência de variáveis 
aleatórias independentes com função de 
probabilidade 


PtX,=0=PlX,=2)=12, nz1 


Diz-se que a variável aleatória X = 
51 Xn/3” tem distribuição de Cantor. 
Determine E[X] e Var(X). 

713 Sejam X,,..., X, variáveis aleatórias inde- 
pendentes e identicamente distribuídas. 
Dizemos que um valor recorde ocorre no 
instante j,) = n,se X,= X, para todo 1 <i 
= j. Mostre que 


(a) Elnúmero de valores recordes] = 
Dedos 
= 

(b) Var(número de valores recordes) = 


2 = DP. 
j=1 


714 No Exemplo 2i, mostre que a variância do 
número de cupons necessários para que se 
acumule um conjunto completo é igual a 

NO. 
a 
(N — iz 


i=1 


Quando N é grande, pode-se mostrar que 
a expressão acima é aproximadamente 
igual (no sentido de que a razão tende a 1 
quando N-00) a Nºar'/6. 

7.15 Considere n tentativas independentes, 
das quais a i-ésima resulta em um sucesso 
com probabilidade p. 

(a) Calcule o número esperado de suces- 
sos nas n tentativas e chame-o de q. 
(b) Para um valor fixo de p, que escolha 
de P,,..., P, maximiza a variância do 
número de sucessos? 
(c) Que escolha minimiza a variância? 
*7,16 Suponha que cada um dos elementos de 
S = (1,2,..,n] deva ser colorido de verme- 
lho ou azul. Mostre que, se 4,,..., 4, são 
subconjuntos de $, há uma maneira de 
colorir em que no máximo SCL/Mi=A 
desses subconjuntos têm fodos os ele- 
mentos da mesma cor (onde |A| repre- 
senta o número de elementos no conjun- 
to 4). 

717 Suponha que X, e X, sejam variáveis alea- 
tórias independentes com média. Supo- 
nha também que Var(X,) = oZ e Var(X,) 
= az. O valor de q é desconhecido, e se 
propõe que qu seja estimado por uma mé- 
dia ponderada de X, e X,. Isto é, AX, + (1 
— AJX, será usado como uma estimativa 
para q para algum valor apropriado de À. 
Que valor de À resulta em uma estimativa 
com menor variância possível? Explique 
por que é desejável usar esse valor de À. 

718 No Exemplo 4f, mostramos que a cova- 
riância das variáveis aleatórias multino- 
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miais N, e N, é igual a -mP,P, ao expres- 
sarmos N, e N, como a soma de variáveis 
indicadoras. Também poderíamos ter ob- 
tido este resultado usando a fórmula 


Var(N; + N) = Var(N;) + Var(N;) + 2 Cov(Ni, Nj) 


(a) Qual é a distribuição de N, + N? 
(b) Use a identidade anterior para mos- 
trar que Cov(N, N) = -mP P.. 
719 Mostre que, se X e Y são identicamente 
distribuídas e não necessariamente inde- 
pendentes, então 


Cov(X+Y,X-YW=0 


720 A Fórmula da Covariância Condicional. 
A variância condicional de X e Y, dado Z, 
é definida como 


Cov(X, Y|Z) = EX — EIXIZDOY — E[YIZDIZI 


(a) Mostre que 
Cov(X, Y|Z) = E[XYIZ] — ELXIZ]E(YIZ] 


(b) Demonstre a fórmula da covariância 
condicional 


Cov(X,Y) = E[Cov(X, Y|Z)] 
+ Cov(E[XIZ], E[Y|Z) 


(c) Faça X = Y na letra (b) e obtenha a 
fórmula da variância condicional. 
721 Suponha que X,,i = 1,...,n, represente as 
estatísticas de ordem de um conjunto de 
n variáveis aleatórias uniformes no inter- 
valo (0, 1), e observe que a função densi- 
dade de X,, é dada por 
x id-gri 0<x<l 


n! 
= q-De-m 
(a) Calcule Var(X,),i = 1,...,n. 
(b) Que valores de i minimizam e maxi- 
mizam Var(X,,), respectivamente? 
722 Mostre que,se Y = a + bX, então 


“-|J+H seb>0 
BlAo A = DE seb < 0 


7.23 Mostre que, se Z é uma variável aleatória 
normal padrão e Y é definida como Y = a 
+ bZ + cZ”, então 


b 


PY) => 
vb? + 20º 
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7.24 Demonstre a desigualdade de Cauchy- 
Schwartz: 


(EIXY)” = EPÊJE?) 


Dica: A menos que Y = -tX para alguma 
constante, caso no qual a desigualdade 
se torna uma igualdade, tem-se que, para 
todo t, 


0 < ELIX + Y)] = ER]? + 2E[XY] + EIY?] 
Portanto, as raízes da equação quadrática 
EDC]º + 2E(XY| + ElY] = 0 


devem ser imaginárias, o que implica o 
discriminante desta equação ser negativo. 

725 Mostre que, se X e Y são independentes, 
então 


E[X|Y = y] = E[X] para todo y 


(a) no caso discreto; 
(b) no caso contínuo. 

726 Demonstre que Elg(X)YI|X] = g(X) 
E[YIXI. 

727 Demonstre que, se E[Y|X = x] = E[Y] 
para todo x, então X e Y são não correla- 
cionados; forneça um contraexemplo para 
mostrar que o inverso não é verdade. 
Dica: Demonstre e use o fato de que 
E(XY] = ELXE(YIX). 

728 Mostre que Cov(X, E[Y|X7) = Cov(X, Y). 

729 Suponha que X,,..., X, sejam variáveis 
aleatórias independentes e identicamente 
distribuídas. Determine 


EIX IX, +... + X, = 2] 


730 Considere o Exemplo 4f, que trata da dis- 
tribuição multinomial. Use a esperança 
condicional para calcular E[N,N |] e depois 
use esse resultado para verificar a fórmu- 
la para Cov(N,, N;) dada no Exemplo 4f. 

731 Uma urna contém inicialmente b bolas 
pretas e w bolas brancas. Em cada rodada, 
adicionamos r bolas pretas e depois reti- 
ramos, aleatoriamente, r bolas do conjun- 
to de b + w + r bolas no interior da urna. 
Mostre que 


E[Número de bolas brancas após a i-ésima 


rodada] = (sr) w 


7.32 Para um evento 4, considere 1, = 1se À 
ocorrer e 1, = 0 caso contrário. Para uma 
variável aleatória X, mostre que 


E(XIA] = ceia 


733 Uma moeda que dá cara com probabili- 
dade p é jogada continuamente. Calcule 
o numero esperado de jogadas que preci- 
sam ser feitas até que uma série de r caras 
seguidas seja obtida. 
Dica: Condicione no instante da primei- 
ra ocorrência de uma coroa para obter a 
equação 


EX]=4 - > pol + El) 
i=1 


+d-p) >, pr 


i=r+1 


Simplifique e resolva para E[X]. 

734 Para uma outra abordagem de solução 
para o Exercício Teórico 7.33, suponha 
que T, represente o número de jogadas 
necessárias para se obter uma série de r 
caras consecutivas. 

(a) Determine E(T]|T..). 

(b) Determine E[7,] em termos de El[T.,] 
(c) O que é E[T,]? 

(d) O que é E[T;]? 

735 A função geratriz de probabilidade da va- 
riável aleatória discreta X de valor inteiro 
não negativo com função de probabilida- 
de p,) = 0, é definida por 


d69)=EST]=5. ps 
j=0 


Seja Y uma variável aleatória geométrica 
com parâmetro p = 1-s,onde0<s<1. 
Suponha que Y seja independente de X, 
e mostre que 


d()=PX < 7) 


7.36 Sorteia-se uma bola de cada vez de uma 
urna contendo a bolas brancas e b bolas 
pretas até que todas as bolas restantes 
sejam da mesma cor. Suponha que M,, 
represente o número esperado de bolas 
deixadas na urna no final do experimento. 


Obtenha uma fórmula recursiva para M,, 
earesolva quandoa =3eb=s5. 

737 Uma urna contém a bolas brancas e b 
bolas pretas. Quando retirada, uma bola 
é devolvida para a urna se for branca; se 
for preta, ela é substituída por uma bola 
branca de outra urna. Suponha que M, 
represente o número esperado de bolas 
brancas na urna após a repetição dessa 
operação por n vezes. 

(a) Deduza a equação recursiva 


Mus = (1 = E) Mm +1 
(b) Use a letra (a) para provar que 


1 n 
(c) Qual é a probabilidade de que a (n + 
1)-ésima bola retirada seja branca? 
7.38 O melhor preditor linear de Y com respei- 
toa X eX,éigualaa + bX, + cX, onde 
a,b ec são escolhidos para minimizar 


EM(Y -(a + bX, + cX))] 


Determine a,bec. 

739 O melhor preditor quadrático de Y com 
respeito a X é iguala a + bX + cXº, onde 
a,b e c são escolhidos para minimizar El(Y 
—(a + bX + cX))]. Determine a,bec. 

740 Use a fórmula da variância condicional 
para determinar a variância de uma va- 
riável aleatória geométrica X com parâ- 
metro p. 

741 Suponha que X seja uma variável alea- 
tória normal com parâmetros y = 0 e o? 
= 1,e considere I, independente de X, tal 
que P(1=1)=1=P(7=0). Agora defina 
Y como 


X sel=1 
P=|x ser=0 
Colocando em palavras, Y tem a mesma 
probabilidade de ser iguala X ou -X. 
(a) Xe Y são independentes? 
(b) Ze Y são independentes? 
(c) Mostre que Y é normal com média 0 e 
variância 1. 
(d) Mostre que Cov(X, Y) = 0. 
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742 Resulta da Proposição 6.1 e do fato do 
melhor preditor linear de Y com respeito 
aXseruy + PAX — uy) que, se 


E[IX] = a + bx 
então 


Iy 
a = dy — Pata 
x 


(Por quê?) Verifique isto diretamente. 
743 Mostre que, para variáveis aleatórias X e 
Z, 


EX -Y] = ED] - E?) 
onde 
Y = E(X|Z] 


744 Considere uma população formada por 
indivíduos capazes de gerar crias do mes- 
mo tipo. Suponha que, no final de sua vida, 
cada indivíduo tenha gerado j novas crias 
com probabilidade P, j = 0, independen- 
temente do número gerado por qualquer 
outro indivíduo. O número de indivíduos 
inicialmente presente, representado por 
Xo é chamado de tamanho da zerésima 
geração. Todas as crias da zerésima gera- 
ção constituem a primeira geração, e seu 
número é representado por X,. Em geral, 
suponha que X, represente o tamanho da 
n-ésima geração. Considere que u = 5 jP; 

[49] j=0 
eo? = 5 (j — u)?P; representem, respecti- 
j=0 
vaméntE a média e a variância do número 
de crias gerado por um único indivíduo. 
Suponha que X, = 1 — isto é, que exista ini- 
cialmente um único indivíduo. 
(a) Mostre que 


EX, = vE[X,4] 


(b) Use a letra (a) para concluir que 


EX )=u 
(c) Mostre que Var(X,) = ou”! + 
pVar(X,1) 
(d) Use a letra (c) para concluir que 
dE a 
o2ur (=) seu *1 
Var(X) = u—l 
no? seu=1 
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O modelo descrito acima é conhecido 
como processo de ramificação, e uma im- 
portante questão para uma população 
que evolui sobre tais premissas é a pro- 
babilidade de que a população acabe se 
extinguindo. Suponha que 7 represente 
esta probabilidade quando a população 
começa com um único indivíduo. Isto é, 


7 = Plpopulação acabe se extinguindo|X, = 1) 


(e) Mostre que 7 satisfaz 
se N 
= > Pr! 
di 


Dica: Condicione no número de crias do 
membro inicial da população. 

745 Verifique a fórmula para a função gera- 
triz de momentos de uma variável alea- 
tória uniforme dada na Tabela 77 Além 
disso, calcule a sua derivada para verificar 
as fórmulas de média e variância. 

746 Para uma variável aleatória normal pa- 
drão X, seja y, = E[Z"]. Mostre que 


0 quando n é ímpar 
=1 (2)! 
e DT quando n = 2; 


Dica: Comece expandindo a função gera- 
triz de momentos de Z em uma série de 
Taylor em torno de O para obter 


Ele'?] de É /2 


+ (2/2) 


747 Suponha que X seja uma variável alea- 
tória normal com média q e variância o”. 
Use os resultados do Exercício Teórico 
746 para mostrar que 


[n/2] ( e ) ur iai)! 
Eej=g E e 
Ê 2jj! 
j=0 
Na equação anterior, [n/2] é o maior in- 
teiro menor ou igual a n/2. Verifique a sua 
resposta fazendon = len =2. 


748 SeY = aX + b,ondea e b são constantes, 
expresse a função geratriz de momentos 
Y em termos da função geratriz de mo- 
mentos X. 

749 A variável aleatória positiva X é chamada 
de log-normal com parâmetros q e o” se 
log(X) é uma variável aleatória normal 
com parâmetros q e variância o”. Use a 
função geratriz de momentos normal 
para determinar a média e a variância de 
uma variável aleatória log-normal. 

7.50 Suponha que X possua função geratriz de 
momentos M(t), e defina w(t) = log M(t). 
Mostre que 


Wo = Var(X) 
751 Use a Tabela 72 para determinar a distri- 
n 
buição de 3 X; quando X,,..., X, são va- 
i=1 


riáveis aleatórias exponenciais indepen- 
dentes e identicamente distribuídas, cada 
uma com média 1/A. 

7.52 Mostre como calcular Cov(X, Y) a partir 
da função geratriz de momentos conjunta 
de XeY. 

753 Suponha que X,.,..., X, possuam uma dis- 
tribuição normal multivariada. Mostre 
que X,,..., X, são variáveis independentes 
se e somente se 


Cov(X, X;) = O quando i * j 


7.54 Se Z é uma variável aleatória normal pa- 
drão, calcule Cov(Z, 2”)? 

7.55 Suponha que Y seja uma variável aleató- 
ria normal com média pg e variância o”, € 
também que a distribuição condicional de 
X dado Y = y seja normal com média y e 
variância 1. 

(a) Mostre que a distribuição conjunta de 
X, Y é igual àquela de Y + Z, Y quan- 
do Z é uma variável aleatória normal 
padrão independente de Y. 

(b) Use o resultado da letra (a) para mos- 
trar que Xe Y possuem uma distribui- 
ção normal bivariada. 

(c) Determine E[X], Var(X) e Corr(X, Y). 

(d) Determine E[Y|X = x]. 

(e) Qual é a distribuição condicional de Y 
dado que X = x? 
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PROBLEMAS DE AUTOTESTE E EXERCÍCIOS 


71 Considere uma lista de m nomes na qual 
o mesmo nome pode aparecer mais de 
uma vez. Suponha que n(i),i = 1....,m,re- 
presente o número de vezes que o nome 
na posição i aparece na lista, e faça com 
que d represente o número de nomes dis- 
tintos na lista. 

(a) Expresse d em termos das variáveis m, 
n(i), i = 1,...,m. Suponha que U seja 
uma variável aleatória uniforme no 
intervalo (0,1) e que X = [mU] + 1. 

(b) Qual é a função de probabilidade de 
XxX? 


(c) Mostre que E[m/n(X)] = d. 

72 Uma urna contém n bolas brancas e m 
bolas pretas que são retiradas uma de 
cada vez de forma aleatória. Determine 
o número esperado de vezes em que uma 
bola branca é imediatamente seguida por 
uma bola preta. 

73 Vinte indivíduos consistindo em 10 casais 
devem se sentar em 5 mesas diferentes, 
com 4 pessoas em cada mesa. 

(a) Se as pessoas se sentam “aleatoria- 
mente? qual é o número esperado de 
casais em uma mesma mesa? 

(b) Se 2 homens e 2 mulheres são escolhi- 
dos aleatoriamente para se sentarem 
em cada mesa, qual é o número es- 
perado de casais sentados na mesma 
mesa? 

74 Se um dado é jogado até que todos as 
suas faces tenham aparecido pelo menos 
uma vez, determine o número esperado 
de vezes que o resultado 1 aparece. 

75 Um baralho de 2n cartas é formado por 
n cartas vermelhas e n cartas vermelhas. 
As cartas são embaralhadas e em segui- 
da viradas uma de cada vez. Suponha 
que, cada vez que uma carta vermelha 
seja virada, ganhemos 1 unidade caso 
mais cartas vermelhas do que pretas te- 
nham sido viradas até aquele momen- 
to (por exemplo, se n = 2 e o resultado 
fosse v p v p, ganharíamos um total de 2 
unidades). Determine a quantia que es- 
peramos ganhar. 

7.6 Considere os eventos 4,, 4,...., 4,, e su- 
ponha que N represente o número de 
eventos que ocorrem. Além disso, consi- 


dere 7 = 1 se todos esses eventos ocorre- 
rem e 1 = 0 caso contrário. Prove a desi- 
gualdade de Bonferroni, isto é, 


P(A An) => PAD) -—(n—1) 
i=1 


Dica: Mostre primeiro que N = n-1 +. 

77 Suponha que X seja o menor valor obtido 
quando k números são escolhidos aleato- 
riamente do conjunto 1,..., n. Determine 
E[X] ao interpretar X como uma variável 
aleatória hipergeométrica negativa. 

78 Um avião prestes a pousar carrega r fa- 
mílias. Um total de n, dessas famílias des- 
pachou ; malas, 5'n; = r. Suponha que, 


j 
quando o avião aterrissa, as N = Din; 


malas saiam do avião em ordem alegiónia: 
Assim que uma família recolhe toda sua 
bagagem, ela sai imediatamente do aero- 
porto. Se a família Sanchez despachou j 
malas, determine o número esperado de 
famílias que saem logo após essa família. 

*79 Dezenove itens na borda de um círculo 
de raio 1 são escolhidos. Mostre que, para 
qualquer escolha de itens, haverá um arco 
do comprimento 1 que contém pelo me- 
nos 4 deles. 

7.10 Suponha que X seja uma variável aleató- 
ria de Poisson com média À. Mostre que, 
se À não é muito pequena, então 


Var(VX) = 0,25 


Dica: Use o resultado do Exercício Teó- 
rico 74 para aproximar E(V'X]. 

711 Suponha no Problema de Autoteste 7.3 
que as 20 pessoas devam se sentar em sete 
mesas, três das quais possuem 4 cadeiras 
e quatro das quais possuem 2 cadeiras. Se 
as pessoas se sentam aleatoriamente, de- 
termine o valor esperado do número de 
casais sentados na mesma mesa. 

712 Indivíduos 1 a n,n > 1, são recrutados 
por uma firma da seguinte maneira: O 
indivíduo 1 começa a firma e recruta o 
indivíduo 2. Os indivíduos 1 e 2 então 
competem para recrutar o indivíduo 3. 
Assim que este é recrutado, os indiví- 


duos 1,2,e 3 competirão para recrutar o 
indivíduo 4, e assim por diante. Suponha 
que quando os indivíduos 1, 2...., i com- 
pitam para recrutar o indivíduo i + 1, 
cada um deles tenha igual probabilidade 
de ser bem-sucedido. 
(a) Obtenha o número esperado de indiví- 
duos 1,...,n que não recrutam ninguém. 
(b) Deduza uma expressão para a va- 
riância do número de indivíduos que 
não recrutam ninguém, e a avalie 
paran=5. 


713 Os nove jogadores em um time de bas- 


quete consistem em 2 centrais, 3 pivôs e 
4 defensores. Se os jogadores formam 3 
grupos com 3 jogadores cada, obtenha (a) 
o valor esperado e (b) a variância do nú- 
mero de trincas formadas por um jogador 
de cada tipo. 


7.14 Um baralho de 52 cartas é embaralhado e 


uma mão de bridge com 13 cartas é distri- 

buída. Suponha que X e Y representem, 

respectivamente, o número de ases e de 

espadas na mão. 

(a) Mostre que X e Y são não correlacio- 
nados. 

(b) Xe Y são independentes? 


7,15 Cada moeda em uma cesta tem um valor. 


Cada vez que uma moeda com valor p é 

jogada, ela dá cara com probabilidade p. 

Quando uma moeda é retirada aleato- 

riamente da cesta, seu valor é uniforme- 

mente distribuído em (0, 1). Suponha que, 
após a moeda ter sido retirada, mas antes 

de ser jogada, você deva dar um palpite e 

dizer se sairá cara ou coroa. Você ganhará 

1 se acertar e perderá 1 se errar. 

(a) Qual é o seu ganho esperado se você 
não souber o valor da moeda? 

(b) Suponha que agora você saiba o valor 
da moeda. Em função de p,o valor da 
moeda, que palpite você deveria dar? 

(c) Nas condições da letra (b), qual é o 
seu ganho esperado? 


7.16 No Problema de Autoteste 71, mostra- 


mos como usar o valor de uma variável 
aleatória uniforme em (0,1) (comumente 
chamada de número aleatório) para obter 
o valor de uma variável aleatória cuja mé- 
dia é igual ao número esperado de nomes 
distintos em uma lista. Entretanto, seu uso 
necessitava que se escolhesse uma posi- 
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ção aleatória e depois se determinasse o 
número de vezes que o nome naquela po- 
sição aparecia na lista. Outra abordagem 
que pode ser mais eficiente quando há um 
grande número de nomes repetidos é a 
seguinte: como antes, comece escolhendo 
a variável aleatória X como no Problema 
71. Depois, identifique o nome na posição 
X e siga a lista, começando do início, até 
que esse nome apareça. Considere 7 = 0 
se você encontrar o nome antes da posi- 
ção X,e 1 = 1 se você encontrá-lo na posi- 
ção X. Mostre que E[ml] = d. 

Dica: Calcule E[1] usando a esperança 
condicional. 


717 Um total de m itens devem ser distribuí- 


dos sequencialmente entre n prateleiras, 
com cada item sendo independentemente 
colocado em cada prateleira j com proba- 
bilidade pj,j = 1,...,n. Obtenha o número 
esperado de colisões, onde uma colisão 
ocorre sempre que um item é colocado 
em uma prateleira não vazia. 


718 Suponha que X seja a extensão da série 


inicial em uma sequência aleatória de n 
1's em 0's. Isto é, se os primeiros k valo- 
res são os mesmos (ou todos iguais a 1, 
ou todos iguais a 0), então X = k. Deter- 
mine E[X]. 


7,19 Há n itens em uma caixa identificada com 


a letra H, e m em uma caixa identificada 
com a letra 7. Uma moeda que dá cara 
com probabilidade p, e coroa com pro- 
babilidade 1 — p é jogada. Cada vez que 
dá cara, um item é removido da caixa H, 
e cada vez que dá coroa, um item é remo- 
vido da caixa T (se uma caixa já tiver sido 
esvaziada, então nenhum item é removido 
dessa caixa). Obtenha o número esperado 
de vezes que a moeda precisará ser jogada 
para que ambas as caixas fiquem vazias. 
Dica: Condicione no número de caras nas 
primeiras n + m jogadas. 


7.20 Suponha que X seja uma variável alea- 


tória não negativa com função distribui- 
ção F. Mostre que, se F(x) = 1 — F(x), 
então 


oo 
ey = [ x"-1F (o dx 


Dica: Comece com a identidade 


XxX 
XP = nf "1 dx 
0 
(9,6) 
=" [ xy (o) dx 
0 


onde 


, Sex < X 


1 
dito da lo caso contrário 


*7,21 Sejam a,....,a,. não todos iguais a 0, tais que 


S&a; = 0. Mostre que existe uma per- 
mutação i,,..., 1, tal que 5.4 aja; < 0. 
Dica: Use o método probabilístico (é in- 
teressante notar que não é necessário que 
exista uma permutação cuja soma de pro- 
dutos de pares sucessivos é positiva. Por 
exemplo, sen=3,a=a,— —l,ea,=2, 
não existe tal permutação). 


722 Suponha que X,i = 1,2,3,sejam variáveis 


aleatórias de Poisson independentes com 

respectivas médias À,,i = 1,2,3. Conside- 

reX=X +XeY=X, + X, Diz-se que 

o vetor aleatório X, Y possui distribuição 

de Poisson bivariada. 

(a) Determine E[X] e E[Y]. 

(b) Determine Cov(X, Y). 

(c) Determine a função de probabilidade 
conjunta P[X = 1,Y =jl. 


7.23 Seja (X, Y),i = 1,..., uma sequência de 


vetores independentes e identicamente 
distribuídos. Isto é, X,, Y, é independen- 
te de e possui a mesma distribuição que 
X,, Y,, e assim por diante. Embora X, e 
Y, possam ser dependentes, X, e Y, são 
independentes quando i * j. Suponha 
que 


uz = EX), uy=ElYi]), o2=Var(X), 
o; = Var(Y), p= Corr(X;, Y;) 


Determine Corr(3 24 Xi, 1 Yj). 


7,24 Três cartas são selecionadas aleatoria- 


mente de um baralho comum de 52 car- 

tas. Suponha que X represente o número 

de ases selecionados. 

(a) Determine E[XJo ás de espadas é es- 
colhido]. 

(b) Determine E[Xlpelo menos um ás 
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padrão com média q e variância 1. Quere- 
mos determinar E[D(X)]. Para fazer isso, 
suponha que Z seja uma variável aleató- 
ria normal padrão independente de X e 
considere 


(a) Mostre que E[H|X = x] = D(). 

(b) Mostre que E[D(X)] = PIZ < X). 

(c) Mostre que E[D(X)] = DP). 

Dica: Qual é a distribuição de X — 2º 
Este problema aparece em estatística. Su- 
ponha que você deva observar o valor de 
uma variável X que é normalmente distri- 
buída com média desconhecida q e variân- 
cia 1, e que você queira testar a hipótese 
de que a média wu seja maior ou igual a 
O. Claramente você negará essa hipótese 
caso X seja muito pequeno. Se você obser- 
va que X = x, então o valor p da hipótese 
de que a média é maior ou igual a zero é 
definido como a probabilidade de que X 
seja tão pequeno quanto x se q for igual a 
O (seu menor valor possível se a hipótese 
fosse verdadeira). (Supõe-se que um valor 
de p pequeno seja uma indicação de que a 
hipótese é provavelmente falsa.) Como X 
possui distribuição normal padrão quando 
u = 0,0 valor de p que resulta quando X 
= x é igual a (x). Portanto, o argumento 
anterior mostra que o valor esperado de p 
obtido quando a média verdadeira é pu é 


igual a DP). 


726 Uma moeda que dá cara com probabi- 


lidade p é jogada até que um total de n 
caras ou m coroas seja acumulado. Deter- 
mine o número esperado de jogadas. 

Dica: Imagine que a pessoa continue a 
jogar a moeda mesmo após atingir o seu 
objetivo. Suponha que X represente o nú- 
mero de jogadas necessárias para que se 
obtenham n caras, e que Y represente o 
número de jogadas necessárias para que se 
obtenham m coroas. Note que máx(X, Y) 
+ mín(X,Y) = X + Y. Compute E[máx(X, 
Y)] condicionando no número de caras que 
aparecem nas primeiras n + m — 1 jogadas. 


727 Um baralho de n cartas numeradas de 1 a 
n é embaralhado da seguinte maneira: em 
cada etapa, escolhemos aleatoriamente 


seja escolhido). 
725 Seja d uma variável aleatória normal pa- 
drão e X uma variável aleatória normal 


uma das cartas e a movemos para a frente 
do baralho, deixando inalteradas as posi- 
ções relativas das demais cartas. Esse pro- 
cedimento continua até que todas exceto 
uma carta tenham sido escolhidas. Neste 
momento, resulta por simetria que todas 
as n! possíveis sequências de cartas são 
igualmente prováveis. Determine o nú- 
mero esperado de etapas necessárias. 


7.28 Suponha que uma sequência de tentati- 


vas independentes na qual cada tentati- 
va com probabilidade de sucesso p seja 
realizada até que um sucesso ocorra ou 
que um total de n tentativas seja atingido. 
Determine o número médio de tentativas 
realizadas. 

Dica: Os cálculos são simplificados se 
você usar a identidade que diz que, para 
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uma variável aleatória X com valor intei- 
ro não negativo, 


EX)=) PX =) 
i=1 


729 Suponha que X e Y sejam variáveis 


aleatórias de Bernoulli. Mostre que X 
e Y são independentes se e somente se 
Cov(X,Y) = 0. 


7.30 No problema do pareamento generali- 


zado, há n indivíduos dos quais n, usam 
um chapéu de tamanho i, > =) ni = n. Há 
também n chapéus, dos quais h, são de ta- 
manho i, ) 4 A; = n. Se cada indivíduo 
escolhe aleatoriamente um chapéu (sem 
reposição), determine o número esperado 
de indivíduos que escolhem um chapéu 
que se ajusta ao seu tamanho. 


Capítulo 


Teoremas Limites 


ALEATÓRIA DE POISSONH 


8.1 INTRODUÇÃO 


Os mais importantes resultados teóricos na teoria da probabilidade são os teore- 
mas limites. Destes, os mais importantes são as leis dos grandes números e os teo- 
remas do limite central. Usualmente, teoremas são considerados leis de grandes 
números se estiverem interessados em enunciar condições nas quais a média de 
uma sequência de variáveis aleatórias converge (de alguma forma) para a média 
esperada. Por outro lado, teoremas do limite central estão interessados em deter- 
minar condições nas quais a soma de um grande número de variáveis aleatórias 
possui uma distribuição de probabilidade que é aproximadamente normal. 


8.2 DESIGUALDADE DE CHEBYSHEV E 
A LEI FRACA DOS GRANDES NÚMEROS 


Começamos esta seção provando um resultado conhecido como a desigualdade 
de Markov. 


Proposição 2.1 A desigualdade de Markov 
Se X é uma variável aleatória que apresenta apenas valores não negativos en- 
tão, para qualquer a > 0, 


ppx = a) = FI 
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Demonstração Para a > 0, suponha 


1 seX=za 
I= E 
O caso contrário 


e note que, como X = 0, 


I= 


ES 


Calculando as esperanças da última desigualdade, obtemos 


E[] = ste 


o que, como E[1] = P(X = a), demonstra o resultado. 
Como um corolário, obtemos a Proposição 2.2. 


Proposição 2.2 A desigualdade de Chebyshey 


Se X é uma variável aleatória com média finita q e variância o, então, para 


qualquer valor k > 0, 


2 
o 
PIX — ul =k) < 


Demonstração Como (X — wu) é uma variável aleatória não negativa, 


podemos aplicar a desigualdade de Markov (com a = k”) para obter 


EX — u)?] 


P(X —- u? =k)=< o 


(21) 


Mas como (X — u)' = k se e somente se |X — u| = k,a Equação (2.1) é 


equivalente a 


EX — wu)? Ê 
Rpe=g= E a e, 


e a demonstração está completa. 


U 


A importância das desigualdades de Markov e Chebyshev está no fato de 
elas nos permitirem deduzir limites para as probabilidades quando conhecemos 
somente a média, ou a média e a variância, da distribuição de probabilidade. 
Naturalmente, se a distribuição verdadeira fosse conhecida, as probabilidades 
desejadas poderiam ser calculadas de forma exata e com isso não precisaría- 


mos recorrer a limites. 


Exemplo 2a 


Suponha que se saiba que o número de itens produzidos por uma fábrica du- 


rante uma semana seja uma variável aleatória com média 50. 


(a) O que se pode dizer sobre a probabilidade de que a produção desta sema- 


na seja superior a 75 itens? 
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(b) Se é sabido que a variância da produção de uma semana é igual a 25, 
então o que se pode dizer sobre a probabilidade de que a produção desta 
semana esteja entre 40 e 60? 


Solução Seja X o número de itens produzidos em uma semana. 


(a) Pela desigualdade de Markov, 


EX] 50 2 
PK>sS ==" 


(b) Pela desigualdade de Chebyshev, 


2 


fo) 1 
P(IX — =1 = ES 
IX -s=10=T =; 


Portanto, 


á 
PIX — 50] <10)=1 - q => 


Assim, a probabilidade de que a produção desta semana esteja entre 40 e 60 é 
de pelo menos 0,75. E 


Como a desigualdade de Chebyshev é válida para todas as distribuições da 
variável aleatória X, não podemos esperar que o limite da probabilidade esteja 
muito próximo da probabilidade real em muitos casos. Por exemplo, considere 
o Exemplo 2b. 


Exemplo 2b 
Se X é uniformemente distribuída ao longo do intervalo (0, 10), então, como 
ELX] = 5 e Var(X) = 2, resulta da desigualdade de Chebyshev que 

25 


>—— = 0,52 
3(16) e 


PIX —5|>4=< 


enquanto o resultado exato é 
P(|X-5|> 4) = 0,20 


Assim, embora a desigualdade de Chebyshev esteja correta, o limite superior 
que ela fornece não está particularmente próximo da probabilidade real. 

Similarmente, se X é uma variável aleatória normal com média q e variân- 
cia o”, a desigualdade de Chebyshev diz que 


Rim 


PIX — ul > 20) = 


enquanto a probabilidade real é dada por 


Sl 


PUX — ul > 20) =" É | > j =2[1- (2)]= 0,0456 E 
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A desigualdade de Chebyshev é frequentemente utilizada como uma fer- 
ramenta teórica para demonstrar resultados. Este uso é ilustrado primeiro pela 
Proposição 2.3 e depois, de maneira mais importante, pela lei fraca dos grandes 
números. 


Proposição 2.3 Se Var(X) = 0, então 
PX = E(X]) = 1 


Em outras palavras, as únicas variáveis aleatórias com variâncias iguais a O são 
aquelas que são constantes com probabilidade 1. 


Demonstração Pela desigualdade de Chebyshev, temos, para qualquer n 
= 1, 


1 
ex — ul] > 1-0 
n 


Fazendo nº e usando a propriedade da continuidade das probabilidades, 


obtemos 
0= lim Pfx — u| > =| lim Es — 4] > )| 
n>>00 n n—+00 n 
=P(X ay 
e o resultado está demonstrado. D 


Teorema 2.1 A lei fraca dos grandes números 

Seja X, X,... uma sequência de variáveis aleatórias independentes e iden- 
ticamente distribuídas, cada uma com média finita E[X,| = u. Então, para 
qualquer e > 0, 


pé + + X 


u a | —>0 quando n>oco 
n 


Demonstração Vamos demonstrar o teorema com a única hipótese adi- 
cional de que as variáveis possuam uma variância finita o”. Agora, como 


X E X PERITOS 4 2 
g(fAtA] E Var (HH th) AS 
n n n 


resulta da desigualdade de Chebyshev que 


di Fed 
hn 


e o resultado está demonstrado. 


A lei fraca dos grandes números foi demonstrada originalmente por James 
Bernoulli para o caso especial de variáveis aleatórias com valores O ou 1 (isto 
é, de Bernoulli). Seu enunciado e sua demonstração para este teorema foram 
apresentados no livro Ars Conjectandi, que foi publicado em 1713, oito anos 
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após a sua morte, por seu sobrinho Nicholas Bernoulli. Note que, como a desi- 
gualdade de Chebyshev não era conhecida naquela época, Bernoulli teve que 
empregar uma demonstração bastante engenhosa para estabelecer o seu resul- 
tado. A forma geral da lei fraca dos grandes números apresentada no Teorema 
2.1 foi demonstrada pelo matemático russo Khintchine. 


8.3 OTEOREMA DO LIMITE CENTRAL 


O teorema do limite central é um dos resultados mais extraordinários na teoria 
da probabilidade. Em linhas gerais, ele diz que a soma de um grande número 
de variáveis aleatórias independentes tem uma distribuição que é aproxima- 
damente normal. Com isso, ele não somente fornece um método simples para 
o cálculo de probabilidades aproximadas para somas de variáveis aleatórias 
independentes, mas também ajuda a explicar o extraordinário fato de que fre- 
quências empíricas de muitas populações naturais exibem curvas na forma de 
um sino (isto é, normais). 

Em sua forma mais simples, o teorema do limite central é enunciado da 
seguinte maneira. 


Teorema 3.1 O teorema do limite central 
Seja X, X,... uma sequência de variáveis aleatórias independentes e identi- 
camente distribuídas, cada uma com média q e variância o”. Então, a distri- 
buição de 
X + + X — ny 
on 


tende à distribuição normal padrão quando n > ºº. Isto é para —-v <a <., 


X ++ X — ny 1 f. “29 
P <aio—— e*/2 dx quando n>00 
I ovn 27 —00o q 


A chave para a demonstração do teorema do limite central é o lema a se- 
guir, que enunciamos sem apresentar uma demonstração. 


Lema 3.1 

Seja Z,, Z,,... uma sequência de variáveis aleatórias com funções distribui- 
ção F,, e funções geratrizes de momentos M,,,n = 1;seja também Z uma 
variável aleatória com função distribuição F, e função geratriz de momen- 
tos M,.Se M,(t) > Mt) para todo t, então F,,(t) —> Ft) para todo t no 
qual F,(t) é contínua. 


Se Z é uma variável aleatória normal padrão, então, como M,(t) = é! 2 ob- 
temos do Lema 3.1 que, se M,(t) > Palo quando n > , então F,,(t) > D(t) 
quando n 5 0º. 

Estamos agora prontos para demonstrar o teorema do limite central. 


Demonstração do Teorema do Limite Central: Vamos supor primeiro que u 
=(Qe o! = 1. Vamos demonstrar o teorema sob a hipótese de que a função ge- 
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ratriz de momentos de X,, M(t), exista e seja finita. Agora, a função geratriz de 
momentos de X;/./n é dada por 


tX; É 
E = t|=M| — 
coa] | (a) 
n n 
Logo, a função geratriz de momentos de 3' X;/,n é dada por [m (5) R 
Considere i=1 


L(t) = log M(t) 
e note que 
L(0) =0 
M'(0) 
M(0) 
= u 
=0 
M(O)M"(0) — [M'(O)J? 
[M(co)]2 


L'(0) = 


L”(0) = 
= E(X?] 
=1 


Agora, para demonstrar o teorema, devemos mostrar que [M(t/V/mD)]" > e? 
quando n > , ou, equivalentemente, que nL(t//n) > É quando n > 0º. Para 
mostrarmos isso, observe que 


Let -L'4 Fe 
lim dd = lim san pela regra de L"Hôpital 
n>o0 n7 n>00 —-2n”? 
p 
= im | Li 
n50| 2n71/2 
NR AZ -3/2,2 
lim fee] novamente pela regra 
Ee =2n de L'Hôpital 


E 
25 
| 
x 
ART mi 
Elia 
ee 
IT 
Lita] 


Assim, O teorema do limite central está demonstrado quando y = 0e o” = 1. 
O resultado é agora estendido para o caso geral considerando-se as variáveis 
aleatórias padronizadas X* = (X; — u)/o e aplicando-se o resultado anterior, 


já que E[X*] = 0e Var(XN — 1. 
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Observação: Embora o Teorema 3.1 afirme apenas que, para cada a, 


Xi ++ Xy — ny 


P 
on 


= à >D(a) 


pode-se, na verdade, mostrar que a convergência é uniforme em a [dizemos que 
fa) — f(a) uniformemente em a se, para cada £ > 0, existir um N tal que |f(a) 
— f(a)| < £ para todo a sempre que n > NJ. 


A primeira versão do teorema do limite central foi demonstrada por De- 
Moivre em 1733 para o caso especial de variáveis aleatórias de Bernoulli com p 
= À O teorema foi em seguida estendido por Laplace para o caso de p arbitrário 
(como uma variável aleatória binomial pode ser tratada como sendo a soma de 
n variáveis aleatórias de Bernoulli independentes e identicamente distribuídas, 
isso justifica a aproximação normal para a distribuição binomial que apresenta- 
mos na Seção 5.4.1). Laplace também descobriu a forma mais geral do teorema 
do limite central dada no Teorema 3.1. Sua demonstracão, contudo, não era com- 
pletamente rigorosa e, de fato, não poderia ter sido feita rigorosamente. Uma de- 
monstração verdadeiramente rigorosa para o teorema do limite central foi apre- 
sentada primeiramente pelo matemático russo Liapounoff entre 1901 e 1902. 

Este importante teorema é ilustrado em um módulo dedicado ao teorema 
do limite central na página deste livro na internet. Lá, é possível obter gráficos 
da função densidade da soma de n variáveis aleatórias independentes e identi- 
camente distribuídas identificadas com os números 0, 1, 2, 3, 4. Quando utilizar 
esse módulo, entre com a função de probabilidade e o valor de n desejado. A 
Figura 8.1 mostra os gráficos obtidos para uma função de probabilidade especí- 
fica quando (a)n = 5, (b)n = 10,(c)n = 25e (d)n = 100. 


Exemplo 3a 


Um astrônomo está interessado em medir a distância, em anos-luz, entre o seu 
observatório e uma estrela. Embora o astrônomo disponha de uma técnica de 
medição, ele sabe que, em função da variação das condições climáticas e de 
erros normais, cada vez que faz uma medição ele não obtém a distância exata, 
mas sim uma estimativa deste parâmetro. Como resultado, o astrônomo planeja 
fazer uma série de medições e então usar o valor médio dessas medições como 
seu valor estimado da distância real. Se o astrônomo acredita que os valores das 
medições são variáveis aleatórias independentes e identicamente distribuídas 
com média comum d (a distância real) e variância comum 4 (em anos-luz), 
quantas medições precisam ser feitas para que se garanta que a distância esti- 
mada tenha uma precisão de +0,5 anos-luz? 


Solução Suponha que o astrônomo decida fazer n observações. Se X,, X,,..., 
X, são as n medições, então, do teorema do limite central, tem-se que 


n 

> X-nd 

ee i=1 
2yn 
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Teorema do Limite Central 


Forneça as probabilidades e o número de variáveis 
aleatórias a serem somadas. O resultado fornece a 
função de probabilidade da soma e também sua 
média e variância. 


Média = 10,75 


Variância = 12,6375 


Figura 8.1(a) 


possui aproximadamente uma distribuição normal padrão. Com isso, 


PsgssE- -dEs0s|= 05 ME «7, = 05%? 
vn vn vn 
not | -g|-L |=20[2" 1-1 
4 ia 4 e 4 


Portanto, se o astrônomo quiser, por exemplo, estar 95% certo de que seu valor 
estimado tenha uma precisão de +0,5 anos-luz, ele deverá fazer n* medições, 
onde n* é tal que 
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Teorema do Limite Central 


Forneça as probabilidades e o número de variáveis 
aleatórias a serem somadas. O resultado fornece a 
função de probabilidade da soma e também sua 
média e variância. 


PO 


P1 


P2 


P3 


Figura 8.1(b) 


Assim, da Tabela 5.1 do Capítulo 5, 


nt 
4 


=1,96 ou nº=(7,84) = 61,47 


Como n* não é um valor inteiro, ele deverá fazer 62 observações. 

Note, no entanto, que a análise anterior foi feita sob a hipótese de que a 
aproximação normal é uma boa aproximação quando n = 62. Embora este seja 
usualmente o caso, em geral a questão de quão grande precisa ser n para que a 
aproximação seja “boa” depende da distribuição de X,. Se o astrônomo estiver 
interessado neste aspecto e não desejar correr riscos, ele poderá recorrer à de- 
sigualdade de Chebyshev. Já que 


n n 
E D|=d Var ) Dl- is 
= s Fars de 
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Teorema do Limite Central 


Forneça as probabilidades e o número de variáveis 
aleatórias a serem somadas. O resultado fornece a 
função de probabilidade da soma e também sua 
média e variância. 


édia = 53,75 


Variância = 63,1875 


Pai 


x 
x 
x 
x 
x 
x 


Figura 8.1(c) 


a desigualdade de Chebyshev fornece 


n 


X; 4 16 
P Das > 0,5 TES 


Com isso, se ele fizer n = 16/0,05 = 320 observações, ele terá 95% de certeza de 
que sua estimativa terá uma precisão de 0,5 anos-luz. E 


Exemplo 3b 


O número de estudantes que se matriculam em um curso de psicologia é 
uma variável aleatória de Poisson com média 100. O professor encarregado 
do curso decidiu que, se o número de matrículas for maior ou igual a 120, ele 
dará aulas para duas turmas separadas. Por outro lado, se esse número for 
menor que 120, ele dará as aulas para todos os estudantes juntos em uma 
única turma. Qual é a probabilidade de que o professor tenha que dar aulas 
para duas turmas? 


Forneça as probabilidades e o número de variáveis 
aleatórias a serem somadas. O resultado fornece a 
função de probabilidade da soma e também sua 
média e variância. 
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Teorema do Limite Central 


PO 


p1 


P2 


P3 


0,25 


0,15 


0,1 


0,3 


100] 


Média = 215 


Variância = 252,75 


Figura 8.1 (d) 


Solução A solução exata 


E 
-100 (100) 
EE, i 
:=120 


não fornece diretamente uma resposta numérica. Entretanto, lembrando que 
uma variável aleatória de Poisson com média 100 é a soma de 100 variáveis 
aleatórias independentes, cada uma com média 1, podemos usar o teorema do 
limite central para obter uma solução aproximada. Se X representa o número 
de estudantes que se matriculam no curso, temos 


P(X = 120) = P(X = 119,5) (a correção de continuidade) 


X — 100 119,55 — 100 
> 


100 100 
= 1 — D(1,95) 


2 


0,0256 
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onde usamos o fato de que a variância de uma variável aleatória de Poisson é 
igual à sua média. E 


Exemplo 3c 


Se 10 dados honestos são rolados, determine a probabilidade aproximada de 
que a soma obtida esteja entre 30 e 40, inclusive. 


Solução Suponha que X, represente o valor do i-ésimo dado, i = 1,2,...,10. 
Já que 


7 35 
E(Xi) = > Var(X;) = E[X2] — (E[X;) = > 
o teorema do limite central resulta em 
poiegensn o SA em 
“po. 350 350 
1 12 12 
x 29(1,0184) — 1 
= 0,692 = 


Exemplo 3d 


Suponha que X,i = 1,..., 10, sejam variáveis aleatórias independentes, cada 
uma uniformemente distribuída ao longo do intervalo (0, 1). Calcule uma 


10 
aproximação para P | RE SR | 
i=1 


Solução Como E[X;] = le Var(X;) = > temos, pelo teorema do limite cen- 
tral, 
10 
E pk =* 6-5 
P DA se md 
; jo Jicd) 
12 12 
=1- d(V1,2) 
= 0,1367 
10 
Portanto, >: X; será maior que 6 apenas 14% do tempo. E 
i=1 
Exemplo 3e 


Um professor tem 50 provas para corrigir. O tempo necessário para corrigir 
cada uma das 50 provas é uma variável aleatória independente com distribui- 
ção que possui média de 20 minutos e desvio padrão de 4 minutos. Aproxime 
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a probabilidade de que o professor corrija pelo menos 25 provas nos primeiros 
450 minutos de trabalho. 


Solução Se X, é o tempo necessário para corrigir a i-ésima prova, 
25 
X=5X 
i=1 


é o tempo necessário para corrigir as primeiras 25 provas. Como o professor 
corrigirá as primeiras 25 provas nos primeiros 450 minutos de trabalho se o 
tempo necessário para corrigi-las for menor ou igual a 450, vemos que a proba- 
bilidade desejada é P[X = 450). Para aproximar esta probabilidade, usamos o 
teorema do limite central. Agora, 


25 
E[X] = >) ELXi] = 25(20) = 500 
fes 


25 
Var(X) = > Var(X;) = 25(16) = 400 


i=1 


Consequentemente, sendo Z uma variável aleatória normal padrão, temos 
X — 500 450 — 500, 
«/400 /400 
= P(Z = -2,5) 
=P(Z =>2,5) 
=1-—- d(2,5) = 0,006 E 


P(X = 450) = P( 


Teoremas do limite central também existem quando as variáveis aleató- 
rias X, são independentes mas não necessariamente identicamente distribuídas. 
Uma versão, que não é de forma alguma a mais geral, é a seguinte. 


Teorema 3.2 Teorema do limite central para variáveis aleatórias inde- 
pendentes 
Suponha que X, X... seja uma seguência de variáveis aleatórias indepen- 
dentes com respectivas médias e variâncias u, = E[X]] eo? = Var(X). Se (a) 
as variáveis aleatórias X, forem limitadas uniformemente, isto é, para algum 
M, P(IX|< M) = 1 para todo ie (b) 3) 0?=o0 — então 

=1 


3X — wu) 
i=1 


P <ast>P(a) quando n>500 
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| Nota Histórica 


Pierre-Simon, Marquês de Laplace 


O teorema do limite central foi originalmente proposto e demonstrado 
pelo matemático francês Pierre-Simon, Marquês de Laplace, que chegou 
ao teorema a partir de suas observações de que erros de medição (que 
podem usualmente ser considerados como sendo a soma de um grande 
número de pequenas forças) tendem a ser normalmente distribuídos. 
Laplace, que também era um famoso astrônomo (e de fato chamado de 
“Newton francês”) trouxe grandes contribuições à teoria da probabilida- 
de e à estatística. Laplace também popularizou o uso da probabilidade na 
vida cotidiana. Ele acreditava fortemente na importância disso, conforme 
indicado nas seguintes citações retiradas de seu libro Teoria Analítica da 
Probabilidade: “Vemos que a teoria da probabilidade é no fundo somente 
o senso comum reduzido ao cálculo; ela nos faz apreciar com exatidão o 
que mentes pensantes percebem como que por instinto, muitas vezes sem 
se dar conta disso. (...) É extraordinário que esta ciência, que surgiu da 
análise dos jogos de azar, tenha se tornado o mais importante objeto do 
conhecimento humano. (...) As mais importantes questões da vida são, em 
sua grande maioria, apenas problemas de probabilidade” 

A aplicação do teorema do limite central para mostrar que os erros de 
medição possuem praticamente uma distribuição normal é vista como uma 
importante contribuição para a ciência. De fato, nos séculos dezessete e dezoi- 
to, o teorema do limite central era frequentemente chamado de lei da frequên- 
cia de erros. Veja as palavras de Francis Galton (retiradas de seu livro Herança 
Natural, publicado em 1889): “Não conheço nada tão capaz de impressionar a 
imaginação quanto a maravilhosa forma de ordem cósmica descrita pela “Lei 
da Frequência do Erro! A Lei poderia ter sido personificada e deificada pelos 
gregos, se eles a tivessem conhecido. Ela reina com serenidade e discrição no 
meio da mais selvagem confusão. Quanto maior forem a multidão e a aparen- 
te anarquia, mais perfeito é o seu poder. É a lei suprema da irracionalidade” 


8.4 A LEI FORTE DOS GRANDES NÚMEROS 


A lei forte dos grandes números é provavelmente o resultado mais famoso na 
teoria da probabilidade. Ela diz que a média de uma sequência de variáveis 
aleatórias independentes com mesma distribuição converge, com probabilida- 
de 1, para a média daquela distribuição. 


Teorema 4.1. A lei forte dos grandes números 
Seja X, X,... uma sequência de variáveis aleatórias independentes e iden- 


ticamente distribuídas, cada uma com média finita qp = E[X,). Então, com 
probabilidade 1, 
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MM + X ++ 
n 
Como uma aplicação da lei forte dos grandes números, suponha que seja 
realizada uma sequência de tentativas independentes de um experimento. Su- 
ponha que E seja um evento fixo do experimento e que P(E) represente a pro- 
babilidade de que E ocorra em qualquer tentativa particular. Fazendo 


> 4 quando n > 


1 se E ocorrer na i-ésima tentativa 
X= : E ; 
O se E não ocorrer na i-ésima tentativa 
temos, pela lei forte dos grandes números, que, com probabilidade 1, 


torto srj=PE) (4.1) 


Como X, + --- + X, representa o número de vezes em que o evento E ocorre 
nas primeiras n tentativas, podemos interpretar a Equação (4.1) como se ela 
dissesse que, com probabilidade 1, a proporção limite do tempo de ocorrência 
do evento E é justamente P(E). 

Embora o teorema possa ser demonstrado sem essa hipótese, nossa de- 
monstração da lei forte dos grandes números supõe que as variáveis aleatórias 
X, possuem um quarto momento finito. Isto é, supomos que E[X ] =K<o, 

Demonstração da Lei Forte dos Grandes Números: Para começar, suponha 
que u, a média de X,, seja igual a 0. Faça S, = >) X; e considere 

i=1 
ESG) = ELOA + e + ADM + eo + X) 
x (X1 Ad cê An) (X1 ate ester e X,)] 


A expansão do lado direito da equação anterior resulta em termos da forma 


x! 


1º 


XX XIX), XÍXGXk € XiAGXXI 
onde i, j, k e | são todos diferentes. Como todas as variáveis aleatórias X, têm 
média 0, resulta da independência dessas variáveis que 
E[XG X;] = EIXPEU;] = 0 
EXE X;Xk] = EIXTIEDG ED = 0 
E[X;X;Xk X1) = 0 


4 
Agora, para um dado par i e j, haverá ( 5) ) = 6 termos na expansão que serão 


iguais a XE X). Com isso, expandindo o produto anterior e calculando as espe- 
ranças termo a termo, obtemos 


* Isto é, a lei forte dos grandes números diz que 


Plim 04 ++ X)m=0)=1 
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lS$] = nEUtÃ] + 6(3 ) ELÊ 7] 
=nK + 3n(n — DEIX?]EIX?] 
onde uma vez mais utilizamos a hipótese de independência. Agora, como 
0 = Var(X?) = ELX!] — (EIXZ)? 
temos 
(ELO)? = EX] = K 
Portanto, do desenvolvimento anterior, obtemos 


E[SS] = nK + 3n(n — DK 


o que implica que 


4 


n4 n3 n2 


Portanto, 


n=1 n=1 


[9,9] 
Mas isso implica que, com probabilidade 1, >) S4/n! < oo (pois se houver uma 
n=1 
probabilidade positiva de que a soma seja infinita, então o seu valor esperado é 
infinito). Mas a convergência da série implica que seu n-ésimo termo tenda a 0; 
portanto, podemos concluir que, com probabilidade 1, 
RR 
lim 2=0 
n—00 n 
Mas se s /nº = (Sn/n)º tende a zero, então S,/n também tende a zero; portanto, 
provamos que, com probabilidade 1, 
Sn : 
— 50 à medida quen > º 
n 
Quando q, a média de X,, for diferente de 0, podemos aplicar o argumento 
anterior às variáveis aleatórias X, — u para obter que, com probabilidade 1, 


j 2X — q) 
Im > —— = 


n—>00 4 n 


i= 


0 
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ou, equivalentemente, 


n 


o que demonstra o resultado. Õ 


A lei forte é ilustrada em dois módulos presentes na página deste livro na 
internet. Os módulos consideram variáveis aleatórias independentes e identi- 
camente distribuídas identificadas com os números 0, 1,2,3 e 4. Eles simulam 
os valores de n dessas variáveis aleatórias; as proporções de tempo em que cada 

n 


resultado ocorre, bem como a média amostral resultante 3) X;/n, são indica- 
i=1 

das e apresentadas em formato gráfico. Ao utilizar esses módulos, que diferem 

somente no tipo de gráfico apresentado, você deve fornecer as probabilidades 


Lei Forte dos Grandes Números 


Forneça as probabilidades e o número de tentativas 
a serem simuladas. O resultado fornece o número 
total de vezes que cada resultado ocorre e a 
média de todos os resultados. 


E 


SAR o 
* Começar 
ba 


Média Teórica = 2,05 


Média Amostral = 1,89 


Figura 8.2(a) 
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e o valor desejado de n. A Figura 8.2 ilustra os resultados de uma simulação 
utilizando uma função de probabilidade específica e (a) n = 100, (b) N = 1000 
e (c)n =10.000. 

Muitos estudantes ficam inicialmente confusos com a diferença entre as 
leis fraca e forte dos grandes números. A lei fraca dos grandes números diz que, 
para qualquer valor n* grande específico, é provável que (X, +... + X Jln* 
esteja próximo de q. Entretanto, ela não diz que (X, +... + X,)/n permanece- 
rá próximo de u para todos os valores de n maiores que n*. Assim, ela deixa 
aberta a possibilidade de que grandes valores de |(X, +... + X,)/n — u| possam 
ocorrer de forma infinitamente frequente (embora em intervalos infrequentes). 
A lei forte mostra que isso não pode ocorrer. Em particular, ela implica, com 
probabilidade 1, para qualquer valor positivo £, que 


fo . 


será maior que s apenas um número finito de vezes. 


Lei Forte dos Grandes Números 


Forneça as probabilidades e o número de tentativas 
a serem simuladas. O resultado fornece o número 
total de vezes que cada resultado ocorre e a 
média de todos os resultados. 


Média Teórica = 2,05 


Média Amostral = 2,078 


Figura 8.2(b) 
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A lei forte dos grandes números foi demonstrada originalmente, no caso 
especial de variáveis aleatórias de Bernoulli, pelo matemático francês Borel. 
A forma geral da lei forte apresentada no Teorema 4.1 foi demonstrada pelo 
matemático russo A. N. Kolmogoroy. 


8.5 OUTRAS DESIGUALDADES 


Às vezes enfrentamos situações em que estamos interessados em obter um 
limite superior para uma probabilidade da forma P(X — u = a] quando co- 
nhecemos a média u = E[X] e a variância o” = Var(X) da distribuição de X e 
quando a é algum valor positivo. Naturalmente, como X — u = a > 0 implica 
que |X — u| = a, resulta de desigualdade de Chebyshev que 


2 


PX-u=za<PIX-uzasS quando a > 0 


Entretanto, como mostra a proposição a seguir, podemos fazer melhor. 


Lei Forte dos Grandes Números 


Forneça as probabilidades e o número de tentativas 
a serem simuladas. O resultado fornece o número 
total de vezes que cada resultado ocorre e a 
média de todos os resultados. 


Média Teórica = 2,05 


Média Amostral = 2,0416 


Figura 8.2(c) 
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Proposição 5.1 Desigualdade de Chebyshev unilateral 
Se X é uma variável aleatória com média O e variância o,, então, para qualquer 
a>o0, 


o? 


E 


Demonstração Considere b > 0 e observe que 
X>aéequivaleneaX+bza+b 


Portanto, 
PX=za9)=PX+4bza+b) 
<P(X+b2=(a+b)?) 


onde se obtém a desigualdade observando-se que, como a + b>0,X + b 
> a + b implica que (X + b) = (a + b). Aplicando-se a desigualdade de 
Markov, a equação anterior resulta em 


EX +b2] 02 +? 


PMES aro? a +by 


Fazendo b = o'/a [o que é facilmente visto como o valor de b que minimiza 
(o? + b?)l(a + b)], obtemos o resultado desejado. O 


Exemplo 5a 

Se o número de itens produzidos em uma fábrica durante uma semana é 
uma variável aleatória com média 100 e variância 400, calcule um limite 
superior para a probabilidade de que a produção desta semana seja de pelo 
menos 120 itens. 


Solução Resulta da desigualdade unilateral de Chebyshev que 


400 1 


P(X =>120)=PX — 100=20)=-——s = 5 
400 + (202 2 


Com isso, a probabilidade de que a produção desta semana seja de 120 ou mais 
itens é de > 

Se tivéssemos tentado obter um limite aplicando a desigualdade de Mar- 
kov, então obteríamos 


EM) 5 


RES EA 
PX=00<= 5 


que é um limite muito mais fraco do que o anterior. n 
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Suponha que X possua média q e variância o.Como X —- yeu— X pos- 
suem ambos média 0 e variância o”, resulta da desigualdade de Chebyshev uni- 
lateral que, para a > 0, 


2 


Cs pa 


02 


a 


Assim, temos o seguinte corolário. 


Corolário 5.1 Se E[X] = pe Var(X) = o”, então, paraa >0, 


o? 
PXzu+ta<s>s—s 
( u+a) RE 

o? 
P(X<u-as>s——s 
( u— a) SEAL 


Exemplo 5b 


Um conjunto de 200 pessoas formado por 100 homens e 100 mulheres é dividido 
aleatoriamente em 100 pares. Forneça um limite superior para a possibilidade de 
que no máximo 30 desses pares sejam formados por um homem e uma mulher. 


Solução Numere os homens arbitrariamente de 1 a 100 e, para i = 1,2,...100, 
suponha 


fe 1 seo homem i forma um par com uma mulher 
*10 caso contrário 


Então X, o número de pares homem-mulher, pode ser escrito como 
100 


X=),X 
i=1 


Como o i-ésimo homem tem a mesma probabilidade de formar um par com as 
demais 199 pessoas, das quais 100 são mulheres, temos 


100 
EX] = PXi=1)= 199 


Similarmente, para i X j, 
E[XX;] = PXG=1,X=1) 
100 99 


=P =DPOG=1M=0= 51 
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onde P(X, = 11X, = 1) = 99/197, já que, dado que o homem i forma um par com 
uma mulher, o homem j tem a mesma probabilidade de formar um par com qual- 
quer uma das 197 pessoas restantes, das quais 99 são mulheres. Com isso, obtemos 


100 


ElX] = >, ElXI] 
i= 


100 


= 400795 


= 50,25 
100 


Var(X) = o Var(X;) + 2 e » Cov(Xi;, X;) 
i=1 


i<j 


100 99 100 ) | 100 99 100)? 
= 10799199 * 2( 2 ) E (555) | 


= 25,126 


A desigualdade de Chebyshev fornece então 


25,126 


P(X =30) = P(X — 50,25] = 2025] = ——s 
p= PII | TETO 


= 0,061 


Assim, há menos de 6 chances em cem de que menos de 30 homens formem 
pares com mulheres. Entretanto, podemos melhorar esse limite usando a desi- 
gualdade de Chebyshev unilateral, que fornece 
P(X = 30)= P(X <= 50,25 — 20,25) 
25,126 
— 25,126 + (20,252 
0,058 = 


Q 


Quando a função geratriz de momentos da variável aleatória X é conheci- 
da, podemos obter limites ainda melhores para P[X = a]. Suponha que 


M(t) = Ele?) 
seja a função geratriz de momentos da variável aleatória X. Então, para t > 0, . 
P(X=a) = Pf => e) 
< E[e“Je”“ pela desigualdade de Markov 
Similarmente, para t < 0, 
P(lX <a) = Pfe* > e” 


< Efe” e" 


Temos portanto as seguintes desigualdades, que são conhecidas como limites 
de Chernoff. 
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Proposição 5.2 Limites de Chernoff 


PiX=a)<=e“M(t para todot>0 
P|X<a)<e“M(t para todot <0 


Como os limites de Chernoff são válidos em todo £, seja no quadrante positivo 

ou negativo, obtemos o melhor limite em P|X = a) usando o £ que minimiza 
-ta 

e CM(t). 


Exemplo 5c Limites de Chernoff para a variável aleatória normal 
padrão 

Se Z é uma variável aleatória normal padrão, então sua função geratriz de mo- 
mentos é M(t) = e? 2. Assim, o limite de Chernoff em P(Z = a] é dado por 


PZ=za<ee? paratodo t>0 


Agora o valor de t, t > 0, que minimiza exp” Pta é 


que é t = a. Assim, para a > 0, temos 


é o valor que minimiza ?/2 — ta, 


PZ=a<se?? 
Similarmente, podemos mostrar que, para a < 0, 


PiZ=<a)= e? E 


Exemplo 5d Limites de Chernoff para a variável aleatória de Poisson 

Se X é uma variável aleatória de Poisson com parâmetro À, então sua função gera- 

triz de momentos é M(t) = eM*—D). Portanto, o limite de Chernoff em P(X = i) é 
PX=]j<=dDeil +>0 


Minimizar o lado direito da última equação é o mesmo que minimizar A(e'— 1) 
- it, e é possível mostrar que o valor mínimo ocorre quando e = i/A.SeiA >1,0 
valor de t será positivo. Portanto, supondo que i > À e fazendo é = i/A no limite 
de Chernoff, obtemos 


PX = ij Ss in (3) 


L 


ou, equivalentemente, 
em À i 
P(X >= i) < een 
P E 
Exemplo 5e 


Considere um jogador que tenha a mesma probabilidade de ganhar ou perder 
1 unidade em cada aposta, independentemente de seus resultados anteriores. 
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Isto é, se X, representa o ganho do jogador na i-ésima aposta, então os X,'s são 
independentes e 


P(X;=1) =P = 1) =5 


n 
Suponha que S, = >: X; represente o ganho acumulado pelo jogador após n 


i=1 
jogadas. Vamos usar o limite de Chernoff em P(S, = a). Para começar, observe 
que a função geratriz de momentos de X, é 
ee +e 


Efe] E 5 


Agora, usando as expansões de e'e e” em séries de McLaurin, vemos que 


Eta sad Ea Dead 
2! 3! 2! 3! 
FR 
oo pn 
io o 
rr 
n=0 


oO [42 n 
(EDP. 
at Á => a!2” 
< 2 a já que (2n)! = n!2 
n=0 
=2"12 
Portanto, 
Efe] => ettr 
Como a função geratriz de momentos da soma de variáveis aleatórias indepen- 
dentes é o produto de suas funções geratrizes de momentos, temos 
E[e'Sn] = (Efe p” 
< qn" 
Usando o resultado anterior juntamente com o limite de Chernoff, obtemos 


P(S, =a) = eta t>0 


O valor de t que minimiza o lado direito da última expressão é o valor que minimi- 
za nt'/2 — ta, e esse valor é t = a/n. Supondo que a > 0 (de forma que t que minimi- 
za a expressão seja positivo) e fazendo t = a/n na última desigualdade, obtemos 


PlS,pzal= em a>0 
A última desigualdade resulta, por exemplo, em 


P(Soz6=e? = 01653 
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enquanto a probabilidade exata é 


P(S, = 6] = Pljogador ganha pelo menos 8 das 10 primeiras apostas) 


GRC 
8 9 10 
= si = (0,0547 


210 1024 E 


A próxima desigualdade tem a ver com esperanças e não com probabilida- 
des. Antes de enunciá-la, precisamos da definição a seguir. 


Definição 


Uma função f(x) real duplamente diferenciável é chamada de convexa se 
f(x) = 0 para todo x; similarmente, ela é chamada de côncava se f(x) = 0. 


Alguns exemplos de funções convexas são f(x) = x, f(x) = e“ e f(x) = —x” 


para x > 0. Se f(x) é convexa, então g(x) = —f(x) é côncava, e vice-versa. 


Proposição 5.3 Desigualdade de Jensen 
Se f(x) é uma função convexa, então 


ElfOO] = HEIX]) 
desde que as esperanças existam e sejam finitas. 


Demonstração Expandindo f(x) na série de Taylor em torno de u = E[X], 
obtemos 


fre — wu? 


fO=fw+fakw-—u) + 3 


onde É é algum valor entre x e pu. Já que re 0, obtemos 
fo) = fu) + fu) — uu) 
Portanto, 
fo = fu) + FX — w) 
O cálculo das esperanças resulta em 
ELfOO] = fu) + PQDEIX — ul] = fu) 


e a desigualdade está demonstrada. U 


Exemplo 5f 


Uma investidora se depara com as seguintes opções: ou ela investe todo o seu 
dinheiro em uma carteira de risco que leva a um retorno aleatório X com mé- 
dia m, ou ela põe todo o seu dinheiro em uma poupança de risco zero que leva 
a um retorno m com probabilidade 1. Suponha que a sua decisão seja tomada 
com base na maximização do valor esperado de u(R), onde R é seu retorno e 
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u é sua função utilidade. Pela desigualdade de Jensen, vê-se que, se u é uma 
função côncava, então E[u(X)] = u(m), e nesse caso a poupança seria a melhor 
alternativa. Por outro lado, se u é uma função convexa, então E[u(X)]| = u(m), 
e com isso o investimento de risco seria a melhor alternativa. [na 


8.6 LIMITANDO A PROBABILIDADE DE ERRO QUANDO 
APROXIMAMOS UMA SOMA DE VARIÁVEIS 
ALEATÓRIAS DE BERNOULLI INDEPENDENTES POR 
UMA VARIÁVEL ALEATÓRIA DE POISSON 


Nesta seção, estabelecemos limites que dizem quão boa é a aproximação de 
uma soma de variáveis aleatórias de Bernoulli independentes por uma variável 
aleatória de Poisson com a mesma média. Suponha que queiramos aproximar 
a soma de variáveis aleatórias de Bernoulli independentes com respectivas mé- 
dias p,, P,,..., P,» Começando com uma sequência Y,,..., Y, de variáveis aleató- 
rias de Poisson independentes, com Y, possuindo média p,, vamos construir uma 
sequência de variáveis aleatórias de Bernoulli independentes X,,..., X, com pa- 
râmetros p,,..., p, tais que 


PlX;*Yi)<p? paracadai 
n n 
Considerando X = 5 X;eY = 5) Y; vamos usar a última desigualdade 


. i=l i=1 
para concluir que 


n 
PX+YSS> op 
i=1 


Finalmente, vamos mostrar que a última desigualdade implica, para qualquer 
conjunto de números reais 4, 


n 
IPXeA)- PYeA= a p? 
i=1 
Como X é a soma de variáveis aleatórias independentes de Bernoulli e Y é uma 
variável aleatória de Poisson, a última igualdade fornece o limite desejado. 
Para mostrar como a tarefa é realizada, suponha que Y,i-—1.,...,n, sejam 
variáveis aleatórias de Poisson independentes com respectivas médias p;. Ago- 
ra, suponha que U,,..., U, sejam variáveis aleatórias independentes (também 
independentes de Y;) definidas como 
U. = EN com probabilidade (1 — pije?i 
'" |1 com probabilidade 1 — (1 — pje?i 


Essa definição utiliza implicitamente a desigualdade 
e?z>1-p 


ao supor que (1- pe” = 1. 
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Em seguida, defina as variáveis aleatórias X, i = 1....,n, como 


X= 0 seY;=U=0 
“ |1 caso contrário 


Observe que 
P(X,=0)=P(Y;=0)P(U; = o =eP( -—-pjei=1-— pi 
PX=D)=1- PX=0)= 
Agora, se X, = 0, então Y, também deve ser igual a O (pela definição de X,). 
Portanto, 
P(X,* Y)=P(X,=1,Y;/*1) 
=P(Y,=0,X=1) + P(Y, > 1) 
=P(Y,=0,U=)+ PY > 1) 
e MS Qu = Ad = et ame 
=p; — pie? 
<p? (jáquel-e?=<p) 


Agora considere X = E XieY = E Y;e note que X é a soma de variáveis 


=1 
aleatórias de Bernoulli depende e que Y é Poisson com o valor esperado 
E[Y] = ELX] = e pi. Note também que a desigualdade X = Y implica X, < Y, 


i=1 
para algum i, então, 


PX +*Y) = P(X,; * Y; para algumi) 


n 
< > Px; * Y;) (desigualdade de Boole) 
i=1 


n 
E 
i=1 


Para qualquer evento B, suponha que Z,, a variável indicadora do evento B, seja 
definida como 


ias 1 se Bocorre 
ni O caso contrário 


Note que, para qualquer conjunto de números reais 4, 


Txea) Ei Iyea) s Txey 


Essa expressão é obtida porque, como uma variável indicadora é iguala 0 ou 1, 
o lado esquerdo da desigualdade é igual a 1 somente quando 1, yes, = 1 € Tea) 
= 0. Mas isso implicaria XE Ae Y $ 4,o que significa que X * Y, então o seu 
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lado direito também seria igual a 1. Calculando as esperanças dessa desigual- 
dade, obtemos 


PXEA|-PVYEAj<PX>Y) 
Invertendo X e Y, obtemos, da mesma maneira, 

PYea)-PXEA)=PXAY) 
Com isso, podemos concluir que 

PXEeA)-PyeAgpj=PXAY) 


n 
Portanto, provamos que, com À = 5: pi, 
i=1 


Observação: Quando todos os p;'s são iguais a p, X é uma variável aleató- 
ria binomial. Assim, a desigualdade anterior mostra que, para qualquer conjun- 
to À de inteiros não negativos, 


z ' —np i 
»(i)ra = prt pp < np 
1€ 


ieA | 


RESUMO 


Dois importantes limites utilizados na teoria da probabilidade são fornecidos 
pelas desigualdades de Markov e Chebyshev. A desigualdade de Markov en- 
volve variáveis aleatórias não negativas e diz que, para uma variável aleatória 
X desse tipo, 


para todo valor positivo a. A desigualdade de Chebyshev, que é uma simples 
consequência da desigualdade de Markov, diz que, se X possui média qu e va- 
riância o”, então, para cada k positivo, 


PIX — uz ko) = ã 
Os dois mais importantes resultados teóricos na teoria da probabilidade são o 
teorema do limite central e a lei forte dos grandes números. Ambos estão relacio- 
nados a sequências de variáveis aleatórias independentes e identicamente dis- 
tribuídas. O teorema do limite central diz que se as variáveis aleatórias possuem 
média q e variância o”, então a distribuição da soma das n primeiras variáveis é, 


Capítulo 8 e Teoremas Limites 487 


para n grande, aproximadamente igual âquela de uma variável aleatória normal 

24: “A : 2 4 . z A : 
com média ny € variância no”. Isto é, se X, i = 1, é cada elemento da sequência 
em questão, então o teorema do limite central diz que, para todo a real, 


<a =|. da 
= 27 —00 


A lei forte dos grandes números requer apenas que as variáveis aleatórias pos- 
suam média finita u. Ela diz que, com probabilidade 1, a média das n primeiras 
variáveis converge para q à medida que n tende ao infinito. Isso implica que, 
se A é qualquer evento específico de um experimento no qual repetições in- 
dependentes são realizadas, então a proporção limite de experimentos cujos 
resultados estão em A será, com probabilidade 1, igual a P(A). Portanto, se 
aceitarmos a interpretação de que “com probabilidade 1” signifique “com cer- 
teza” obtemos uma justificativa teórica para a interpretação da probabilidade 
como uma frequência relativa de longo prazo. 


XM ++ X — ny 


PROBLEMAS 


8.1 Suponha que X seja uma variável alea- 
tória com média e variância iguais a 20. 
O que é possível dizer sobre P[O < X < 
40)? 
8.2 Com sua experiência, um professor sabe 
que a nota de um estudante na prova final 
é uma variável aleatória com média 75. 
(a) Forneça um limite superior para a 
probabilidade de que a nota de um 
estudante exceda 85. Suponha, além 
disso, que o professor saiba que a 
variância da nota de um estudante é 
iguala 25. 
(b) O que se pode dizer sobre a probabi- 
lidade de que a nota de um estudante 
esteja entre 65 e 85? 
(c) Quantos estudantes teriam que fazer 
a prova para assegurar, com probabi- 
lidade mínima de 0,9, que a média da 
turma esteja entre 75 + 5? Não use o 
teorema do limite central. 
8.3 Use o teorema do limite central para re- 
solver a letra (c) do Problema 8.2. 
8.4 Sejam X,,..., X,o variáveis aleatórias de 
Poisson independentes com média 1. 
(a) Use a desigualdade de Markov para 
obter um limite em 


20 
P 2X > 15 
1 


(b) Use o teorema do limite central para 
aproximar 


20 
P/DX>15 
1 


8.5 Cinquenta números são arredondados 
para o inteiro mais próximo e somados. Se 
os erros de arredondamento individuais 
são uniformemente distribuídos ao lon- 
go de (-0,5, 5), obtenha uma aproximação 
para a probabilidade de que a soma resul- 
tante difira da soma exata em mais de 3. 

8.6 Um dado é jogado continuamente até 
que a soma total das jogadas exceda 300. 
Obtenha uma aproximação para a pro- 
babilidade de que pelo menos 80 jogadas 
sejam necessárias. 

8.7 Uma pessoa possui 100 lâmpadas cujos 
tempos de vida são exponenciais indepen- 
dentes com média de 5 horas. Se as lâmpa- 
das são usadas uma de cada vez, sendo a 
lâmpada queimada imediatamente substi- 
tuída por uma nova, obtenha uma aproxi- 
mação para a probabilidade de que ainda 
exista uma lâmpada funcionando após 525 
horas. 

8.8 No problema anterior suponha que seja 
necessário um tempo aleatório, uniforme- 
mente distribuído em (0, 0,5), para que a 
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8.9 


8.10 


8.11 


8.12 


lâmpada queimada seja substituída. Ob- 
tenha uma aproximação para a probabi- 
lidade de que todas as lâmpadas tenham 
queimado após 550 horas. 

Se X é uma variável aleatória gama com 
parâmetros (n, 1), quão grande deve ser n 
para que 


di — 1 > on) < 0,012 


Engenheiros civis acreditam que W, a 
quantidade de peso (em unidades de 
toneladas) que certo vão de uma ponte 
pode suportar sem sofrer danos estrutu- 
rais seja normalmente distribuído com 
média 400 e desvio padrão 40. Suponha 
que o peso (novamente em toneladas) de 
um carro seja uma variável aleatória com 
média 3 e desvio padrão 0,3. Aproxima- 
damente quantos carros devem estar so- 
bre a ponte para que a probabilidade de 
dano estrutural exceda 0,1? 

Muitas pessoas acreditam que a variação 
diária no preço das ações de uma compa- 
nhia na bolsa de valores é uma variável 
aleatória com média O e variância o”. Isto 
é,se Y, representa o preço da ação no n- 


ésimo dia, então 
Y=r+X, nz1 


onde X,, X,,... são variáveis aleatórias in- 


dependentes identicamente distribuídas, 


com média O e variância o”. Suponha que 
o preço atual de uma ação seja 100. Se o 
= 1,0 que pode ser dito a respeito da pro- 
babilidade de que o preço da ação exceda 
105 após 10 dias? 

Dispomos de 100 componentes que colo- 
caremos em funcionamento de forma se- 
quencial. Isto é, o componente 1 é utiliza- 
do primeiro e, se falhar, será substituído 
pelo componente 2, que, em caso de falha, 
será substituído pelo componente 3, e as- 
sim por diante. Se o tempo de vida de um 
componente i é distribuído exponencial- 
mente com média 10 + :/10,i = 1,...,100, 
estime a probabilidade de que o tempo 
de vida total de todos os componentes su- 
pere 1200. Repita agora quando a distri- 
buição do tempo de vida do componente 


8.13 


i é uniformemente distribuído ao longo 

de (0,20 + i/5),i = 1,...,100. 

As notas dos alunos nas provas aplicadas 

por certo professor têm média 74 e desvio 

padrão 14. Esse professor vai aplicar duas 
provas, uma para uma turma de 25 alunos 

e outra para uma turma de 64 alunos. 

(a) Obtenha uma aproximação para a 
probabilidade de que a média das no- 
tas dos alunos na prova da turma de 
tamanho 25 exceda 80. 

(b) Repita a letra (a) para a turma de 64 
alunos. 

(c) Obtenha uma aproximação para a 
probabilidade de que a média das no- 
tas dos alunos na maior turma supere 
aquela da outra classe em 2,2 pontos. 

(d) Obtenha uma aproximação para a 
probabilidade de que a média das no- 
tas dos alunos na turma menor supere 
aquela da outra classe em 2,2 pontos. 


8.14 Certo componente é crítico para a ope- 


8.15 


ração de um sistema elétrico e deve ser 
substituído imediatamente após a sua 
falha. Se o tempo de vida médio deste 
tipo de componente é de 100 horas e 
seu desvio padrão é de 30 horas, quantos 
desses componentes devem estar em es- 
toque de forma que a probabilidade de 
que o sistema permaneça em operação 
contínua nas próximas 2000 horas seja 
de pelo menos 0,95? 

Uma companhia de seguros tem 10.000 
carros segurados. O valor esperado re- 
clamado por cada segurado em um ano 
é de R$240,00, com um desvio padrão de 
R$800. Obtenha uma aproximação para 
a probabilidade de que o total reclamado 
em um ano supere R$2,7 milhões. 


8.16 A.J. tem 20 tarefas que deve realizar em 


sequência, com os tempos necessários 
para cada tarefa sendo variáveis aleató- 
rias independentes com média 50 minu- 
tos e desvio padrão 10 minutos. M. J tem 
20 tarefas que deve realizar em sequên- 
cia, com os tempos necessários para reali- 
zar cada tarefa sendo variáveis aleatórias 
independentes com média 52 minutos e 
desvio padrão 15 minutos. 

(a) Determine a probabilidade de que A. 

J. termine em menos de 900 minutos. 
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(b) Determine a probabilidade de que M. 
J. termine em menos de 900 minutos. 

(c) Determine a probabilidade de que A. 
J. termine antes de M. J. 

8.17 Repita o Exemplo 5b considerando que 
o número de pares homem-mulher seja 
(aproximadamente) uma variável aleató- 
ria normal. Esta parece ser uma suposi- 
ção razoável? h 

8.18 Repita a letra (a) do Problema 8.2 quan- 
do se sabe que a variância da nota de um 
estudante é igual a 25. 

8.19 Um lago contém 4 tipos de peixes. Supo- 
nha que cada peixe pescado tenha a mes- 
ma probabilidade de ser de qualquer um 
desses tipos, e que Y represente o número 
de peixes que precisam ser pescados para 
que se obtenha pelo menos um peixe de 
cada tipo. 

(a) Forneça um intervalo (a, b) tal que 
Pla=Y=b)=o0,90. 

(b) Usando a desigualdade de Chebyshev 
unilateral, quantos peixes precisamos 
pescar para que tenhamos pelo menos 
90% de certeza de que pescaremos 
um peixe de cada tipo? 

8.20 Se X é uma variável aleatória não nega- 


(b) ElVX]? 
(c) Ellog x" 
(d) Ele]? 
8.21 Seja X uma variável aleatória não negati- 
va. Demonstre que 


EX] = (ERP)? = (EpÉD" =... 


8.22 Os resultados do Exemplo 5f mudariam 
se a investidora pudesse dividir o seu di- 
nheiro e investir a fração «,0 < a <1, 
na carteira de risco e o restante na pou- 
pança? Seu retorno em tal investimento 
dividido seria de R = «X + (1 — o)m. 

8.23 Seja X uma variável aleatória de Poisson 
com média 20. 

(a) Use a desigualdade de Markov para 
obter um limite superior para 


p=P(X=>26) 


(b) Use a desigualdade de Chebyshev 
unilateral para obter um limite supe- 
rior para p. 

(c) Use o limite de Chernoff para obter 
um limite superior para p. 

(d) Obtenha uma aproximação para p 
usando o teorema do limite central. 

(e) Determine p rodando um programa 


tiva com média 25, o que se pode dizer apropriado. 
sobre 
(a) EDÊR? 
EXERCÍCIOS TEÓRICOS 
8.1 Se X tem variância o”, então o, a raiz qua- de seu o sinal (ou média) , mostre que, 
drada positiva da variância, é chamada de paraa >0, 
desvio padrão. Se X tem média q e desvio 1 
padrão o, mostre que PR a 


1 
PIX — ul= ko) = 5 


8.2 Se X tem média yu e desvio padrão o, 
a razão r = lul/o é chamada de relação 
sinal-ruído de X. A ideia é que a variá- 
vel aleatória X pode ser escrita como X 
= u+(X-u),com q representando o 
sinale X - q, o ruído. Se definimos |(X 
— u)/u| = D como sendo o desvio de X 


8.3 Calcule a relação sinal-ruído — isto é 
lulio, onde u = E[X] e o” = Var(X) - das 
variáveis aleatórias a seguir: 

(a) Poisson com média À; 

(b) binomial com parâmetros n e p; 
(c) geométrica com média 1/p; 

(d) uniforme no intervalo (a, b); 
(e) exponencial com média 1/A; 

(f) normal com parâmetros q, o”. 
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8.4 Suponha que Z,,n = 1, seja uma sequência 
de variáveis aleatórias e c, uma constante 
tal que, para cada e > 0, P[|Zn -c|> e) >0 
quando n > «o. Mostre que, para qualquer 
função contínua limitada g, 


Elg(Zn)] > g(c) quando nº5 o 


8.5 Seja f(x) uma função contínua definida 
em 0 =x = 1. Considere as funções 


BwW)=5F (5) ( É ) a sn 
k=0 


(chamadas de polinômios de Bernstein) e 
demonstre que 


nim Bnlo) = fl) 


Dica: Suponha que X,, X,.... sejam variá- 
veis aleatórias de Bernoulli independen- 
tes com média x. Mostre que 


Ba) = ef (tt ão] 


e então use o Exercício Teórico 8.4. 
Como é possível mostrar que a con- 
vergência de B,(x) em f(x) é uniforme 
em x, O raciocínio anterior fornece uma 
demonstração probabilística do famoso 
teorema da análise de Weierstrass, que 
diz que qualquer função contínua em 
um intervalo fechado pode ser aproxi- 
mada por um polinômio. 
8.6 (a) Seja X uma variável aleatória discreta 
cujos valores possíveis são 1, 2,.... Se 
P(X = k) é não decrescente em k = 1, 
2,..., demonstre que 
E(X 
PlX=kj< Et 
(b) Seja X uma variável aleatória contí- 
nua não negativa com função densi- 
dade não decrescente. Mostre que 


paratodo x > 0 


2EIX 
og = “28 


8.7 Suponha que um dado seja jogado 100 
vezes. Seja X, o valor obtido na i-ésima 
jogada. Calcule uma aproximação para 


100 
P [x =) I<a<é6 
1 


8.8 Explique por que uma função aleatória 
gama com parâmetros (t, À) tem apro- 
ximadamente uma distribuição normal 
quando + é grande. 

8.9 Suponha que uma moeda honesta seja 
jogada 1000 vezes. Se as 100 primeiras 
jogadas resultam em cara, que propor- 
ção de caras você espera nas 900 jogadas 
finais? 

8.10 Se X é uma variável aleatória com média 
A, mostre que, parai <A, 
ee) 


it 


PX<ij< 


8.11 Seja X uma variável aleatória binomial 
com parâmetros n e p. Mostre que, para 


i>np, 
(a) o mínimo de e “E[e*] ocorre quando 
t>0, 
tétal quee' = vp» Onde q =1-p. 


(b) PX =) par — py. 

8.12 O limite de Chernoff para uma variável 
aleatória normal padrão Z fornece P[Z > 
a) = EP? a > 0. Mostre, considerando a 
densidade de Z, que o lado direito da de- 
sigualdade pode ser reduzido pelo fator 2. 
Isto é, mostre que 


P(Z > a)= e a>0 


8.13 Mostre que, se E[X] <0e 0 * 0 é tal que 
Ele] = 1,então 6 > 0. 


PROBLEMAS DE AUTOTESTE E EXERCÍCIOS 


8.1 O número de carros vendidos semanal- 
mente em uma concessionária é uma 
variável aleatória com valor esperado 16. 


Forneça um limite superior para a proba- 

bilidade de que 

(a) as vendas feitas na próxima semana 
excedam 18; 


(b) as vendas feitas na próxima semana 
excedam 25. 

8.2 Suponha no Problema 1 que a variância 
do número de carros vendidos semanal- 
mente seja igual a 9. 

(a) Forneça um limite inferior para a pro- 
babilidade de que o número de ven- 
das na próxima semana esteja entre 
10 e 22, inclusive. 

(b) Forneça um limite superior para a 
probabilidade de que as vendas da 
próxima semana excedam 18. 

8.3 Se 


E(X]=75 E[Y]=75 Var(X) = 10 
Var(Y) = 12 Cov(X,Y) = —3 


forneça um limite superior para 
(a) PIIX- Y| > 15) 
(b) P(X>Y+15) 
(co) PY >X+ 15) 

8.4 Suponha que o número de unidades pro- 
duzidas diariamente na fábrica A seja 
uma variável aleatória com média 20 e 
desvio padrão 3, e que o número produ- 
zido na fábrica B seja uma variável alea- 
tória com média 18 e desvio padrão 6. 
Supondo independência, deduza um limi- 
te superior para a probabilidade de que 
mais unidades sejam produzidas hoje na 
fábrica B do que na fábrica A. 

8.5 A quantidade de tempo que certo tipo de 
componente funciona antes de falhar é 
uma variável aleatória com função densi- 
dade de probabilidade 


fx) = 2x 


Assim que o componente falha, ele é 
imediatamente substituído por outro do 
mesmo tipo. Se X, representa o tempo de 
vida do i-ésimo componente utilizado, 


O<x<i 


n 
então S, = >. X; representa o instante da 
i=1 
n-ésima falha. A taxa de falhas r a longo 
prazo é definida por 
e Pee Sa 
Supondo que as variáveis aleatórias X, 
i = 1, sejam independentes, determine r. 
8.6 No Problema de Autoteste 8.5, quantos 
componentes devem estar disponíveis 
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para que se tenha 90% de certeza de que 

o estoque dure pelo menos 35 dias? 

8.7 A manutenção de uma máquina requer 
dois passos separados, sendo o tempo 
necessário para o primeiro passo uma 
variável aleatória exponencial com mé- 
dia 0,2 horas, e o tempo necessário para 
o segundo passo uma variável aleatória 
exponencial independente com média 
0,3 horas. Se um técnico tem que fazer 
a manutenção de 20 máquinas, obtenha 
um valor aproximado para a probabili- 
dade de que todo o trabalho possa ser 
finalizado em 8 horas. 

8.8 Em cada aposta, um jogador perde 1 
com probabilidade 0,7 perde 2 com pro- 
babilidade 0,2 ou ganha 10 com proba- 
bilidade 0,1. Obtenha uma aproximação 
para a probabilidade de que o jogador 
esteja perdendo após suas 100 primeiras 
apostas. 

8.9 Determine t de forma que a probabili- 
dade de que o técnico do Problema de 
Autoteste 8.7 termine os 20 trabalhos de 
manutenção em um tempo t aproximada- 
mente igual a 0,95. 

8.10 Uma companhia de cigarros alega que a 
quantidade de nicotina em um de seus ci- 
garros é uma variável aleatória com mé- 
dia 2,2 mg e variância 0,3 mg. Entretanto, 
verificou-se um conteúdo médio de 3,1 mg 
em 100 cigarros escolhidos aleatoriamente. 
Obtenha uma aproximação para a proba- 
bilidade de que a média seja de 3,1 mg ou 
mais se a alegação da companhia for verda- 
deira. 

8.11 Cada uma das pilhas em um conjunto de 
40 pilhas tem a mesma probabilidade de 
ser do tipo A ou do tipo B. Uma pilha do ' 
tipo A dura um tempo total com média 
50 e desvio padrão 15; pilhas do tipo B 
duram um tempo total com média 30 e 
desvio 6. 

(a) Obtenha uma aproximação para a 
probabilidade de que o tempo de vida 
total das 40 pilhas exceda 1700. 

(b) Suponha que se saiba que 20 das pilhas 
são do tipo A e 20 são do tipo B. Ago- 
ra, obtenha uma aproximação para a 
probabilidade de que o tempo de vida 
total das 40 pilhas exceda 1700. 


8.12 Uma clínica tem a mesma probabilidade 


de ter 2,3 ou 4 médicos voluntários traba- 
lhando certo dia. Independentemente do 
número de médicos voluntários presen- 
tes, o número de pacientes atendidos por 
esses médicos é uma variável aleatória de 
Poisson com média 30. Suponha que X 
represente o número de pacientes atendi- 
dos na clinica em um dado dia. 

(a) Determine E[X]. 

(b) Determine Var(X). 
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(c) Use uma tabela de distribuições nor- 
mais padrão para obter uma aproxi- 
mação para P(X > 65]. 


8.13 A lei forte dos grandes números diz que, 


com probabilidade 1, as médias aritméti- 
cas sucessivas de uma sequência de variá- 
veis aleatórias independentes e identica- 
mente distribuídas convergem para sua 
média comum q. Para que convergem as 
médias geométrica? Isto é, qual é 


n 
: lino 
E phoda 
ja 


Capítulo 


Tópicos Adicionais em 
Probabilidade 


9.1 O PROCESSO DE POISSON 


Antes de definirmos um processo de Poisson, vamos lembrar que uma função f 
é chamada de o(h) se 

lim Hd) =0. 

h>0 


Isto é, fé o(h) se, para valores pequenos de A, f(h) é pequeno mesmo em rela- 
ção a h. Suponha agora que “eventos” ocorram em instantes aleatórios de tem- 
po e que N(t) represente o número de eventos ocorridos no intervalo (0, t]. O 
conjunto de variáveis aleatórias [N(t), t = 0] é chamado de processo de Poisson 
comtaxaA,A > 0,se 


(1) N(0) = 0. 
(ii) Os números de eventos ocorridos em intervalos de tempo disjuntos forem 
independentes. 
(iii) A distribuição do número de eventos ocorridos em certo intervalo de tem- 
po depender somente da extensão do intervalo e não de sua localização. 
(iv) PIN(h) = 1) = Ah + o(h). 
(v) PIN(h) = 2) = o(h). 


Assim, a condição (i) diz que o processo começa no instante 0. A condição 
(ii), a hipótese de incrementos independentes, diz, por exemplo, que o número 
de eventos ocorridos até o tempo t [isto é, N(t)] é independente do número de 
eventos ocorridos entre te t +s [isto é, N(t + s) — N(t)]. A condição (iii), a hi- 
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pótese de incrementos estacionários, diz que a distribuição de probabilidade de 
N(t + s) — N(t) é a mesma para todos os valores de t. 

No Capítulo 4, apresentamos um argumento que mostrou que as condições 
anteriores determinam que N(t) possui distribuição de Poisson com média Aí. 
Este argumento se baseava no fato da distribuição de Poisson ser uma versão 
limite da distribuição binomial. Vamos agora obter esse resultado por um mé- 
todo diferente. 


Lema 1.1 
Para uma variável aleatória de Poisson com taxa À, 
PIN() =0)= E 
Demonstração Seja P(t) = PÍN(t) = 0). Deduzimos uma equação dife- 
rencial para P,(t) da seguinte maneira: 
Pot + D=PINGA+h=0) 

=PN(O)=0,N(t+h — N(1D=0) 

= P(N() =O0)PING + h) — N() =0) 

= Po(D[1 — Ah + o(h)] 
onde as duas últimas equações resultam da condição (ii) mais o fato de que 
as condições (iv) e (v) implicam P(N(h) = 0| = 1 — Ah +o(h). Portanto, 

Pot + h) — Pot h 
o(t + : O apo + 2 


Agora, fazendo h — 0, obtemos 
Pott) = —APo(t) 


ou, equivalentemente, 
PO 
Po(t) 


o que resulta, por integração, em 
log Po(t) = —At + c 
ou 
Po(t) = Ke 
Como P,(0) = PÍN(O) = 0) = 1, obtemos 
Po(t) = e O 


Em um processo de Poisson, suponha que 7, represente o instante de ocor- 
rência do primeiro evento. Além disso, para n > 1, suponha que T, represente 
o tempo decorrido entre o (n — 1)-ésimo e o n-ésimo evento. A seguência [T,, 
n=1,2,...) é chamada de sequência de tempos interchegada. Por exemplo, se T, 
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=5e 7T, = 10, então o primeiro evento do processo de Poisson terá ocorrido 
no instante 5 e o segundo, no instante 10. 

Vamos agora determinar a distribuição de 7T,. Para fazer isso, primeiro no- 
tamos que o evento (T, > t)] ocorre se e somente se nenhum dos eventos do 
processo de Poisson ocorrer no intervalo (0, £]; assim, 


P(T; > H=PINO=0)=eM 


Portanto, T, possui distribuição exponencial com média 1/A. Agora, 
P(T > )= E[P(T > TI] 


Entretanto, 
P(T, > Ti =s) = P(0 eventosem (s,s + dlTi =s) 
= P(0 eventos em (s,s + t]) 
eg 
onde as duas últimas equações resultam das hipóteses de independência e de 
incrementos estacionários. Daí, concluímos que T, também é uma variável 
aleatória exponencial com média 1/A e, além disso, que T, é independente de 
T,. A repetição do mesmo argumento leva à Proposição 1.1. 


Proposição 1.1 7T,, T,,... são variáveis aleatórias exponenciais independentes, 
cada uma com média 1/À. 


Outra quantidade de interesse é S,, o tempo de chegada do n-ésimo evento, 
também chamado de tempo de espera até o n-ésimo evento. Vê-se facilmente que 


n 
Sn=) T n=>1 
i=1 


com isso, da Proposição 1.1 e dos resultados da Seção 5.6.1, tem-se que S, pos- 
sui distribuição gama com parâmetros n e À. Isto é, a densidade de probabilida- 
de de S, é dada por 


(Ax)ro1 


>0 
Quan Se 


Fs, (0) = Ae 


Estamos agora prontos para demonstrar que N(t) é uma variável aleatória 
de Poisson com média At. 


Teorema 1.1 Em um processo de Poisson com taxa À, 


e MAD 


PNG =n)=—— 


Demonstração Note que o n-ésimo evento do processo de Poisson ocor- 
rerá antes do tempo t ou neste exato instante se e somente se o número de 
eventos ocorridos até t for maior ou igual a n. Isto é, 


Ng =nos,<t 
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assim, 
PINO =)=PINO=zn)-PINO=zn+41) 
= P(Sy < Hj = PlSam = 1) 


t n-1 Tá n 
= / pote ANT dx — À pie A)” dx 
0 (n — D! 0 n! 


Mas a fórmula de integração por partes fudv = uv — fvducomu = 
e“ e dy = AA) (n-1)!dx resulta em 


t À n-1 n t n 
À pix AD dx — par ADO + É pemir A)! dx 
0 (n — D! n! 0 n! 


o que completa a demonstração. O 


9.2 CADEIAS DE MARKOV 


Considere uma sequência de variáveis aleatórias X,, X,,... e suponha que o 
conjunto de valores possíveis dessas variáveis seja (0, 1,..., M). É útil inter- 
pretar X, como o estado de algum sistema no tempo n e, de acordo com essa 
interpretação, dizer que o sistema está no estado j no tempo n se X, = i. Diz- 
se que a sequência de variáveis aleatórias forma uma cadeia de Markov se, 
cada vez que o sistema estiver no estado i, existir alguma probabilidade fixa 
— vamos chamá-la de P, — de que o sistema esteja a seguir no estado j. Isto é, 
para io... in ds), 
PXa ===. oA=iÃo=iog)=Pj 

Os valores de P,,0O<=i=M,0<=j= N, são chamados de probabilidades de 
transição da cadeia de Markov e satisfazem 


M 
P=O cd Ppsdo d=0100M 
=0 


(Por quê?) É conveniente arranjar as probabilidades de transição P,; em um 
arranjo quadrado da seguinte forma: 


Poo Po «:- Pom 
Po Pw -- Pim 


Pmo Pm :-- Pmm 


Tal arranjo é chamado de matriz. 
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O conhecimento da matriz de probabilidades de transição e da distribuição 
de X, nos permite, em tese, calcular todas as probabilidades de interesse. Por 
exemplo, a função de probabilidade conjunta de X,...., X, é dada por 


PM, = in Ana = no A =X = ig) 
= PlXn=inAna = in o Mo=ig)PXaa = int, Ão = ig) 
= Pi sina = ipod...» Xo = dg) 


e a repetição contínua desse argumento demostra que 
P P; “Pi, Pio Po = 0) 


Ino inf in-2 in” 


Exemplo 2a 


Suponha que a possibilidade de chuva amanhã dependa somente do fato de es- 
tar chovendo ou não no dia de hoje. Suponha também que, se hoje está choven- 
do, então amanhã choverá com probabilidade «a; se hoje não estiver chovendo, 
então amanhã choverá com probabilidade f. 

Se dissermos que o sistema está no estado O quando chove e no estado 1 
quando não chove, então o sistema anterior é uma cadeia de Markov de dois 
estados com matriz de transição de probabilidades 


ql-—a 
Bolo 
Istoé, Py=-«=1-P,,Po=-B=1-P,. |] 


Exemplo 2b 


Considere um jogador que, em cada rodada, ganhe 1 unidade com probabilida- 
de p ou perca 1 unidade com probabilidade 1 — p. Se considerarmos que o joga- 
dor desiste do jogo quando sua riqueza chega a O ou M, então a sua sequência 
de riquezas é uma cadeia de Markov com probabilidades de transição 
Pim =p=1 =— Piá i= 1..sM — 1 
Po =Pmm=1 n 


Exemplo 2c 
Os físicos Paul e Tatyana Ehrenfest consideraram um modelo conceitual para 
o movimento de moléculas no qual M moléculas estavam distribuídas entre 2 
urnas. Em cada instante de tempo uma das moléculas era escolhida aleatoria- 
mente, removida de sua urna e colocada na outra. Se X, representa o número 
de moléculas na primeira urna imediatamente após a n-ésima mudança, então 
(Xo X,....)] é uma cadeia de Markov com probabilidades de transição 
M-i 

M 

i : 

Pu= 4 O<isM 


O=isM 


Pim = 


P;=0 selj-il>1 E 
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Assim, em uma cadeia de Markov, P, representa a probabilidade de que um 
sistema no estado i mude para o estado j na próxima transição. Também podemos 


definir a probabilidade de transição de dois estágios pe de que um sistema atual- 
mente no estado i mude para o estado j após duas transições adicionais. Isto é. 


PO = PlXmy2 = jlXm = 1) 


A probabilidade EO pode ser calculada a partir de P, da seguinte forma: 


PO = P(Xo = jlXo =) 
M 
=5 Po =jM=kXo=i 
k=0 
M 
=5 PO =jX =kX = JP = Ko = i 
k=0 


M 
= >, PyPik 
k=0 


Em geral, definimos a probabilidade de transição de n estágios, representa- 
da por Po como 
PO = PXatm =X = 1) 
A Proposição 2.1, conhecida como equações de Chapman-Kolmogorov, mostra 
como Er pode ser calculada. 


Proposição 2.1 As equações de Chapman-Kolmogorov 


M 
BR = PB paratodoO <r <n 
k=0 


Demonstração 
PÇ = P(X, =jlXo =) 
=> PXn=),X = klXo =) 
k 


= 5, Pl, = IX, = k,Xo = JPIX, = klXo =) 
k 
(n—r) pl) 
= Der ki Pix 
k 


Exemplo 2d Uma caminhada aleatória 

Um exemplo de cadeia de Markov com um número finito de espaços de esta- 
dos é a caminhada aleatória, que segue o caminho de uma partícula à medida 
que ela se move ao longo de um eixo unidimensional. Suponha que, em cada 
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instante de tempo, a partícula se mova um passo para a direita ou para a es- 
querda com respectivas probabilidades p e 1 — p. Isto é, suponha que o caminho 
da partícula seja uma cadeia de Markov com probabilidades de transição 


Pim =p= 1 — Pe i= 0,+1,. ate 
Se a partícula está no estado i, então a probabilidade de que ela esteja no es- 
tado j após n transições é a probabilidade de que (n — i + ;)/2 desses passos 
sejam dados para a direitaen — [(n-i + )/2] = (n + i— j)/2 sejam dados para 
a esquerda. Como cada passo será dado para a direita, independentemente dos 


demais, com probabilidade p, resulta que esta é justamente a probabilidade 
binomial 


Pi= asi Re ) pedra — pt 


n 2: SE : : o 7 “ 
onde ( x )é igual a O quando x não é um inteiro não negativo menor ou igual a 


n. A última fórmula pode ser reescrita como 


pm =( an Jetta — prt k=0,+,...,n 


Li42k n + k 
2n+1 2n +1 k+1 —k 
Pd E aa e Le 
k=0,41,...,2n,—(n + 1) n 


Embora Ro represente probabilidades condicionais, podemos usá-la para 
deduzir expressões para probabilidades incondicionais se condicionarmos no 
estado inicial. Por exemplo, 


PX==> PM =X = JP =) 
= Pr PGS) 


i 


Para um grande número de cadeias de Markov, ES converge, à medida que 
n > e, para um valor 7, que depende somente “de j. Isto é, para grandes 
valores de n, a probabilidade de se estar em um estado j após n transições 
é aproximadamente igual a 7,, não importando qual tenha sido o estado ini- 
cial, Pode-se mostrar que uma condição suficiente para que uma cadeia de 
Markov possua essa propriedade é que, para algum n > 0, 
(n) o 

P,; > O paratodoi,j=0,1,...,M (2.1) 
Cadeias de Markov que satisfazem a Equação (2.1) são chamadas de ergódicas. 
Como a Proposição 2.1 resulta em 


M 
(MAD (n) 
P j = >;P x Phj 
k=0 
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tem-se como resultado que, fazendo n > o, para cadeias ergódicas, 


k=0 (2.2) 


Além disso, como 1 = > Be também obtemos, fazendo n50, 
j=0 Es 
20, 
j=0 (2.3) 


De fato, pode-se mostrar que 7,0 = j = M, são as únicas soluções não negati- 
vas das Equações (2.2) e (2.3). Tudo isso é resumido no Teorema 2.1, que enun- 
ciamos sem demonstrações. 


Teorema 2.1 Para uma cadeia de Markov ergódica, 


m= lim P 


(n) 
n>o 


existe, e 7,0 <j< M, são as únicas soluções não negativas de 


M 
n= my 
k=0 


Exemplo 2e 
Considere o Exemplo 2a, no qual supomos que, se hoje está chovendo, então 
amanhã choverá com probabilidade «; e se hoje não está chovendo, então ama- 
nhã choverá com probabilidade 8. Do Teorema 2.1, resulta que as probabilida- 
des 7, e 7, de chuva e de não chuva são dadas, respectivamente, por 

no =amo + Bm 

m=(1-ao+(- Bm 

no + m=1 


o que dá 
B 1l-—-« 
PR O 
i 1l+8-a 


Por exemplo, se « = 0,6 e 8 = 0,3, então a probabilidade limite de chuva no 
n-ésimo dia é 7, = . E 


A grandeza 7, também é igual à proporção de tempo a longo prazo na qual 
a cadeia de Markov está no estado j,j = 0,..., M. Para ver intuitivamente por 
que isso ocorre, suponha que P represente uma proporção de tempo a longo 
prazo no qual a cadeia está no estado j (pode-se demonstrar, usando-se a lei 
forte dos grandes números, que, para uma cadeia ergódica, tais proporções a 
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longo prazo existem e são constantes). Agora, como a proporção de tempo em 
que a cadeia está no estado k é P,, e como, quando no estado k, a cadeia vai 
para o estado j com probabilidade P,, vemos que a proporção de tempo em 
que a cadeia de Markov entra no estado j vinda do estado k é iguala P,P,. A 
soma ao longo de todos os k's mostra que P, a proporção de tempo em que a 
cadeia de Markov entra no estado j, satisfaz 


Pj= Je PkPy 
k 


Como também é claramente verdade que 


Sid 
j 


obtemos, já que pelo Teorema 2.1 7, j = 0,... M, são as únicas soluções das 
equações anteriores, que P, = 7,,j = 0,..., M. A interpretação de proporção a 
longo prazo de 7, é geralmente válida mesmo quando a cadeia não é ergódica. 


Exemplo 2f 

Suponha no Exemplo 2c que estejamos interessados na proporção de tempo 
em que há j; moléculas entrando na urna 1,j = 0;..., M. Pelo Teorema 2.1, essas 
grandezas serão as únicas soluções de 


1 
— X — 
no n1 M 
M -—-j+1 + 1 
m = Tj-1 X 1 + tj x 1 =1,..,M 
M 
1 
M 
»,m=1 
j=0 


MNT 
"= (1) (5) j=0,..,M 


satisfaz as equações anteriores, vemos que estas são as proporções de tempo a 
longo prazo nas quais a cadeia de Markov está em cada um dos estados (veja 
o Problema 9.11 para uma explicação de como seria possível adivinhar essa 
solução). = 


9.3 SURPRESA, INCERTEZA E ENTROPIA 


Considere um evento E que pode ocorrer quando um experimento é realizado. 
Quão surpresos ficaríamos ao saber que E de fato ocorreu? Parece razoável 
supor que a quantidade de surpresa causada pela informação de que E ocorreu 
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deve depender da probabilidade de E. Por exemplo, se o experimento consiste 
em jogar um par de dados, então não ficaríamos muito surpresos ao ouvir que 
É ocorreu quando E representa o evento em que a soma dos pares é par (e 
portanto tem probabilidade >. Por outro lado, certamente ficaríamos mais sur- 
presos ao ouvir que E ocorreu quando E é o evento em que a soma dos dados 
é 12 (e portanto tem probabilidade +=). 

Nesta seção, tentamos quantificar o conceito de surpresa. Para começar, 
vamos concordar que a surpresa que alguém sente ao saber da ocorrência do 
evento E depende somente da probabilidade de E, e vamos representar S(p) 
como a surpresa causada por um evento que tem probabilidade de ocorrência 
p. Determinamos a forma funcional de S(p) primeiramente formulando um 
conjunto razoável de condições que S(p) deve satisfazer e depois demonstran- 
do que os axiomas decorrentes requerem que S(p) tenha uma forma especifica- 
da. Supomos ao longo do texto que S(p) seja definida para todo 0 < p = 1,mas 
que não seja definida para eventos com p = 0. 

Nossa primeira condição é somente um enunciado do fato intuitivo de que 
não há surpresa ao ouvirmos que um evento cuja ocorrência é certa tenha de 
fato ocorrido. 


Axioma 1 
S(1D) = 0 


Nossa segunda condição diz que, quanto mais improvável é a ocorrência de 
um evento, maior é a surpresa causada por sua ocorrência. 


Axioma 2, 
S(p) é uma função estritamente decrescente de p; isto é, se p < q, então 


S(p) > S(g). 


A terceira condição é um enunciado matemático do fato de que esperamos 
intuitivamente que uma pequena mudança em p corresponda a uma pequena 
mudança em S(p). 


Axioma 3 
S(p) é uma função contínua de p. 


Para motivar a condição final, considere dois eventos independentes E e 
F com respectivas probabilidades P(E) = p e P(F) = q. Como P(EF) = pqg,a 
surpresa causada pela informação de que E e F ocorreram é S(pqg). Agora, su- 
ponha que primeiro saibamos que E ocorreu e então, um tempo depois, que F 
também ocorreu. Como S(p) é a surpresa causada pela ocorrência de E, tem-se 
que S(pg) — S(p) representa a surpresa adicional causada pela informação de 
que F também ocorreu. Entretanto, como F é independente de E, saber que E 
ocorreu não muda a probabilidade de F; com isso, a surpresa adicional deve ser 
somente S(g). Esse raciocínio leva à condição final. 


Axioma 4 


S(pq) = S(p) + S(g) 0O<p=1,0<g=1 


Agora, estamos prontos para o Teorema 3.1, que fornece a estrutura de S(p). 
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Teorema3.1 Se S(:) satisfaz os Axiomas 1 a 4, então 


S(p) = —Clog,p 
onde C é um inteiro positivo arbitrário. 
Demonstração Resulta do Axioma 4 que 


Sp?) = S(p) + S(p) = 28(p) 
e por indução que 
S(p"') = mS(p) (3.1) 
Também, já que, para cada n inteiro, S(p) = S(p'”...p””) = n S(p!”), resulta 
que 


1 
Sp") = —S(p) (3.2) 


Assim, das Equações (3.1) e (3.2), obtemos 


= sq) 


n 
o que é equivalente a 
Sp) = xS(p) (3.3) 


sempre que x é um número positivo racional. Mas, pela continuidade de $ 
(Axioma 3), vemos que a Equação (3.3) é válida para todos os valores de x 
não negativos (justifique isso). , 
Agora, para qualquer p,0 < p <1, seja x = —log,p. Então p = (3) ,e, da 
Equação (3.3), 


co) cn) --ome 


onde € = s(3) > S(1) = 0 pelos Axiomas 2 e 1. O 


É comum fazer C = 1,e nesse caso diz-se que a surpresa é representada em 
bits (abreviação para binary digits, ou dígitos binários). 

A seguir, considere a variável aleatória X que deve receber um dos valo- 
res X,,..., x, com respectivas probabilidades p,,..., p,- Como -log p, representa a 
surpresa causada se X recebe o valor x, vemos que a quantidade esperada de 


surpresa com a qual devemos receber o valor de X é dada por 


n 
HA) =— > pilogpi 
i=1 


* No restante deste capítulo, escrevemos log, x como log x. Além disso, usamos In x para 
representar log, x. 
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A grandeza H(X) é conhecida na teoria da informação como a entropia da va- 
riável aleatória X (caso uma das probabilidades p, seja igual a 0, consideramos 
0 log O = 0). Pode-se mostrar (e deixamos isso como exercício) que H(X) é 
maximizada quando todos os p;s são iguais (isso é intuitivo?). 

Como H(X) representa a quantidade média da surpresa de alguém ao ficar 
sabendo o valor de X, ela também pode ser interpretada como se representasse 
a quantidade de incerteza que existe a respeito do valor de X. De fato, na teoria 
da informação, H(X) é interpretada como a quantidade média de informação 
recebida quando o valor de X é observado. Logo, a surpresa média causada por 
X,a incerteza de X e a quantidade média de informação associada a X represen- 
tam o mesmo conceito visto de três pontos de vistas ligeiramente diferentes. 

Agora considere duas variáveis aleatórias X e Y que assumam respectivos 
valores x,,...,X, € Y,...,Ym Com função de probabilidade conjunta 


POsy)=MAX=x,Y=yj 
Resulta que a incerteza quanto ao valor do vetor aleatório (X, Y), representado 


por H(X, Y), é dada por 


H(X,Y) = — 35 p(i,yj log p(xi, yj) 
A 


Suponha agora que Y tenha sido observado como sendo igual a y. Nessa situa- 
ção, a quantidade de incerteza que permanece em X é dada por 


Hy-y 00) = — > p(uily) log p(xily) 


onde 
PGilyp) = PAX = xi]Y = yj) 


Com isso, a quantidade média de incerteza que permanecerá em X após se 
observar Y é dada por 


HyOO) = > Hy=y;00py0) 
) 


onde 
prOp=PiY=yj 


A proposição 3.1 relaciona H(X, Y) a H(Y) e H(X). Ela diz que a incerteza 
quanto ao valor de X e Y é igual à incerteza de Y mais a incerteza média rema- 
nescente em X quando Y é observado. 


Proposição 3.1 
HX,Y = HOY) + Hy(X) 
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Demonstração Usando a identidade p(x, y)) = py(y)p(x/y;), obtém-se 
HX,Y) =— 55. pG,y)) log p(i, yj) 
lj 


=-3 3 prOppkilypllogpr0p + logp(Gilyj] 
ij 


re >prO) logpy(y;) > pGily) 
j i 


— 3 pr0p9 > pGilyp logpGily) 
j i 
=H(OY) + Hy(X) o 


É um resultado fundamental na teoria da informação o fato de que a quan- 
tidade de incerteza em uma variável aleatória X irá, em média, decrescer quan- 
do uma segunda variável aleatória Y for observada. Antes de demonstrar esse 
enunciado, precisamos do lema a seguir, cuja demonstração é deixada como 
exercício. 


Lema 3.1 
Inx=<x-1 x>0 
com igualdade somente em x = 1. 


Teorema 3.2 


HAX) = HO) 


com igualdade se e somente se X e Y são independentes. 


Demonstração 


Hy(X) — H(X) = — 5 5 p(ilyp loglp (xy Ip O) 
ij 
+ 5, PG, y) log p(xi) 
ij 
p(xi) 
E (5) pl 
= DE e 


< loge >) DPG) [o — | pelo Lema 3.1 
i ij t 


= loge 3 >opeopo) — DD) 
i j i j 


=loge[i — 1] 
=0 Hm 


506 Probabilidade: Um Curso Moderno com Aplicações 


9.4 TEORIA DA CODIFICAÇÃO E ENTROPIA 


Suponha que o valor de um vetor discreto X deva ser observado no ponto 4 
e então transmitido para o ponto B por meio de uma rede de comunicações 
que trabalhe com os sinais O e 1. Para fazer isso, primeiro é necessário codificar 
cada valor possível de X em termos de uma sequência de 0ºs e 1's. Para se evitar 
qualquer ambiguidade, requer-se normalmente que nenhuma sequência codifi- 
cada possa ser obtida de uma sequência codificada menor a partir da adição de 
termos a esta sequência menor. 
Por exemplo, se X pode assumir quatro valores possíveis x,,x,, x; € x, então 

uma codificação possível seria 

XxX 00 

x e 01 

x3 & 10 (4.1) 

x eli 


Isto é,se X = x,, então a mensagem 00 é enviada ao ponto B; por outro lado, se 
X = x,, a mensagem 01 é enviada, e assim por diante. Uma segunda codificação 
possível seria 

x & 0 

Xx2 10 

x3 & 110 (4.2) 

x, & 111 


Entretanto, uma codificação como 

XxX 0 

x 1 

Xx3 00 

X4 01 
não é permitida porque as sequências codificadas de x, e x, são ambas exten- 
sões daquela referente a x.. 


Um dos objetivos ao fazer-se uma codificação é minimizar o número esperado 
de bits que precisam ser enviados do ponto A para o ponto B. Por exemplo, se 


1 
PX=m)=> 
1 
PX=0)= 
1 
PX=m)=5 
1 
PX =") =5 


então o código dado pela Equação (4.2) enviaria 1) + i(2) + 5(3) + &(3) = 1,75 
bits, enquanto o código dado pela Equação (4.1) enviaria 2 bits. Portanto, para 
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esse conjunto de probabilidades, a codificação feita pela Equação (4.2) é mais 
eficiente do que aquela feita pela Equação (4.1). 

A discussão anterior dá origem à seguinte questão: para um dado vetor X, 
qual é a máxima eficiência que se pode obter por meio de um esquema de co- 
dificação? A resposta é que, para qualquer codificação, o número médio de bits 
enviados é pelo menos igual à entropia de X. Para demonstrar esse resultado, 
que é conhecido na teoria da informação como o teorema da codificação sem 
ruído, vamos precisar do Lema 4.1. 


Lema 4.1 

Suponha que X assuma os valores possíveis x,,..., xy. Então, para que possa- 
mos codificar os valores de X em sequências binárias (nenhuma das quais 
sendo uma extensão de outra) de respectivos tamanhos n,,..., ny, é neces- 
sário e suficiente que 


i=l 


Demonstração Para um conjunto fixo de N inteiros positivos n,,..., 1, SU- 
ponha que w, represente o número de n;s que são iguais a j,j = 1,.... Para 
que exista um código que atribua n, bits ao valor x, i = 1,..., N, é claramen- 
te necessário que w, = 2. Além disso, como nenhuma sequência binária 
pode ser uma extensão da outra, devemos ter w, = 2º - 2w, (obtém-se essa 
desigualdade porque 2º é o número de sequências binárias de tamanho 2, 
enquanto 2w, é o número de sequências que são extensões da sequência 
binária w, de tamanho 1). Em geral, o mesmo raciocínio mostra que deve- 
mos ter 


Vig ED ga sp RE = sat dO (4.3) 


para todo n = 1,.... De fato, um pouco de raciocínio convence o leitor de 

que essas condições não são somente necessárias, mas também suficientes 

para que exista um código que atribua n, bitsa x, i = 1,...,N. 
Reescrevendo a desigualdade (4.3) como 


Re E ENE O TR PL POR O o ca = A PRO 


e dividindo por 2”, obtemos as condições necessárias e suficientes, isto é, 


n 1 J 
> W; (5) < 1 paratodon (4.4) 


j=1 
n 1 j 
Entretanto, como >: w; (3) é crescente em n, resulta que a Equação (4.4) 


j=1 
será verdade se e somente se 


j=1 
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Prova-se agora o resultado, pois, da definição de w; como o número de n;s 
que são iguais a j, resulta que 


im) E : 


Agora estamos prontos para demonstrar o Teorema 4.1. 


Teorema 4.1 O teorema da codificação sem ruído 
Suponha que X receba os valores x,,..., xy com respectivas probabilidades 
p(x1),..., p(xy). Então, para qualquer codificação que atribua n, bits a x, 


N N 
Do mipG) = HO) = — 5 p(xi logp(xi) 


i=1 i=1 


N 
Demonstração Seja P; = p(x;),gi= pri 52", i=1,...,N. Então, 
j=1 
N N 

P; P; 
— > Pilog (=) = —loge 5 Pin (=) 

i=1 Hi i=1 H 

N 
=loge> P;ln (&) 


i=1 


N 
=< loge 3 P; (a — 1) pelo Lema 3.1 
i=1 


N 


N 
= O já que A E Sa =1 
i=1 i=1 


Portanto, 
N N 
— > Pilog P; <— > Pilogai 
i=1 i=1 
N N 
= 53 n;P; + log no 2H 
i=1 j=l 
N 
< E» n;P; pelo Lema 4.1 
i=1 E 
Exemplo 4a 


Considere uma variável aleatória X com função de probabilidade 


= | o 1 = = 1 
p(x) = 5) p(x2) = 4 P(x3) = p(x4) = 3 
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Já que 


1 1 1 1 1 1 
H(X) = l l | 
ne? [51085 + qlo8q + log] 
a Es 2 iz 3 
e 
= 1,75 
resulta do Teorema 4.1. que não há esquema de codificação mais eficiente que 
XxX 0 
X9 €& 10 
x3 e 110 
x, & 111 E 
Para a maioria dos vetores aleatórios, não existe uma codificação para a 
qual o número médio de bits enviados atinja o limite inferior H(X). Entretanto, 
é sempre possível elaborar um código tal que o número médio de bits esteja em 
1 de H(X). Para demonstrar isso, defina n, como o inteiro satisfazendo 


—logp(x;) = n; < —logp(x;) + 1 


Agora, 
N N N 
som < >. 2lesptr E Dr(a =1 
i=1 i=1 i=1 


então, pelo Lema 4.1, podemos associar a x, sequências de bits com tamanhos 
noi =1,.., N.O comprimento médio de tal sequência, 


N 
L=5> mpi) 


i=1 


satisfaz 
N N 
— 3 plú)logp() = L< —-Spúlogpa) + 1 
i=1 i=1 
ou 
HO <SL<HO)+41 
Exemplo 4b 


Suponha que 10 jogadas independentes de uma moeda com probabilidade p 
de dar cara sejam feitas no ponto A, e que o resultado seja transmitido para o 
ponto B. O resultado deste experimento é um vetor aleatório X = (X,...., X o), 
onde X, é igual a 1 ou O dependendo do resultado obtido com a moeda. Pelos 
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resultados desta seção, vemos que L, o número médio de bits transmitidos por 
qualquer código, satisfaz 


HM) <L 
com 
L<=H(X)+1 


em pelo menos um código. Agora como os X;'s são eventos independentes, re- 
sulta da Proposição 3.1 e do Teorema 3.2 que 


N 
HOO) = HAM, XD) =) H(X) 
i=i 
= —10[plogp + 4 — pJlogd — p)] 


Sep = à, então H(X) = 10, e com isso resulta que não há nada melhor a ser 
feito do que codificar X por seu valor real. Por exemplo, se as 5 primeiras joga- 
das derem cara e as 5 últimas derem coroa, então a mensagem 1111100000 é 
transmitida para o ponto B. 

Entretanto, se p < E, podemos muitas vezes fazer melhor usando um esque- 
ma de codificação diferente. Por exemplo, se p = i, então 


1 1 3 3 


Logo, existe uma codificação para a qual o comprimento médio da mensagem 
codificada não é maior que 9,11. 
Uma codificação que é, neste caso, mais eficiente do que o código identida- 
de consiste em dividir (X,,..., X,o) em 5 pares de duas variáveis aleatórias cada e 
então, para i = 1,3,5,7,9, codificar cada um dos pares da seguinte maneira: 
X4;=0,X,1 =0 <> 0 
X; =0,Xus1 =1+<> 10 
Xi; = LXuw1 = 0 «> 110 
Xi; = LXus =1+ 111 
A mensagem total transmitida corresponde à codificação sucessiva desses pares. 
Por exemplo, se o resultado TTTHHTTTTH é observado (H = cara, T = 


coroa), então a mensagem 010110010 é enviada. O número médio de bits ne- 
cessários para transmitir essa mensagem é 


LO 06 +60) 6) ]-5 


= 8,44 = 
Até este ponto, consideramos que a mensagem enviada no ponto À é rece- 
bida sem erros no ponto B. Entretanto, sempre há erros que podem ocorrer por 
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causa de distúrbios aleatórios ao longo do canal de comunicação. Tais distúr- 
bios poderiam fazer, por exemplo, com que a mensagem 00101101, enviada do 
ponto A, chegasse ao ponto B na forma 01101101. 

Vamos supor que um bit transmitido no ponto A seja recebido correta- 
mente no ponto B com probabilidade p, independentemente de bit a bit. Tal 
sistema de comunicações é chamado de canal binário simétrico. Suponha, além 
disso, que p = 0,8 e que queiramos transmitir uma mensagem formada por um 
grande número de bits de A para B. Assim, a transmissão direta da mensagem 
resultará em uma probabilidade de erro de 0,2 para cada bit, o que é bastante 
elevado. Uma maneira de reduzir esta probabilidade de erro seria transmitir 
cada bit 3 vezes e então fazer a sua decodificação usando a regra da maioria. 
Isto é, poderíamos usar o seguinte esquema: 


Codificar Decodificar Codificar Decodificar 
000 111 
001 110 
0000 010 >0 15111 101 51 
100 011 


Observe que, se não ocorrer mais de um erro na transmissão, o bit será de- 
codificado corretamente. Com isso, a probabilidade de erro é reduzida a 


(0,2)” + 3(0,2)(0,8) = 0,104 


o que é uma melhora considerável. De fato, está claro que podemos fazer a 
probabilidade de erro tão pequena quanto quisermos simplesmente repetindo 
o bit muitas vezes e então decodificando-o pela regra da maioria. Por exemplo, 
o esquema 


Codificar Decodificar 


O>sequência de 17 0's Pela regra da maioria 
Issequência de 17 1's 


reduzirá a probabilidade de erro a um valor menor que 0,01. 

O problema com este tipo de esquema de codificação é que, embora reduza 
a probabilidade de erro de bits, isso é feito comprometendo-se a taxa efetiva de 
bits enviados por sinal (veja a Tabela 9.1). 

De fato, neste momento pode parecer inevitável para o leitor que reduzir 
a probabilidade de erro para O sempre resulta na redução da taxa efetiva de 
transmissão de bits por sinal para 0. Entretanto, um extraordinário resultado 
da teoria da informação conhecido como teorema da codificação com ruído, 
formulado por Claude Shannon, demonstra que este não é o caso. Enunciamos 
esse resultado no Teorema 4.2. 
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Tabela 9.1 Esquema de codificação por repetição de bits 


Probabilidade de erro (por bit) Taxa (bits transmitidos por sinal) 


0,20 1 
0,10 033(= 4) 
0,01 0,06 (= 4) 


Teorema 4.2 O teorema da codificação com ruído 

Há um número C tal que, para qualquer valor R menor ou igual a C, e para 
qualquer e > 0, existe um esquema de codificação e decodificação que trans- 
mite a uma taxa média de R bits enviados por sinal com uma probabilidade 
de erro (por bit) menor que s. O maior valor de C - vamos chamá-lo de C* — 
é chamado de capacidade de canal, e, para um canal binário simétrico, 


C*=1 + plogp + (1 — p)log( — p) 


RESUMO 


O processo de Poisson com taxa À consiste em um conjunto de variáveis aleató- 
rias (N(t), t > 0) que estão relacionadas a um processo em que eventos ocorrem 
aleatoriamente. Por exemplo, N(t) representa o número de eventos ocorridos 
entre os tempos O e t. As características que definem o processo de Poisson são 
as seguintes: 


(1) O número de eventos que ocorrem em intervalos de tempos disjuntos é 
uma variável aleatória independente; 
(ii) A distribuição do número de eventos que ocorrem em um intervalo de- 
pende somente do tamanho do intervalo. 
(iii) Eventos ocorrem um de cada vez. 
(iv) Eventos ocorrem a uma taxa À. 


Pode-se mostrar que N(t) é uma variável aleatória de Poisson com média Aí. 
Além disso, se as variáveis aleatórias T, i = 1, correspondem aos intervalos de 
tempo entre eventos sucessivos, então essas variáveis aleatórias são indepen- 
dentes e possuem distribuição exponencial com taxa À. 

Uma sequência de variáveis aleatórias X,, n = 0, cada uma das quais assu- 
mindo um dos valores 0,..., M, é chamada de cadeia de Markov com probabili- 
dades de transição P, se, para todo 11, ip,..., ips bj, 


PM =X =X = into Xo=io)=Pi; 


Se interpretarmos X, como sendo o estado de algum processo no tempo n, en- 
tão uma cadeia de Markov corresponde à sequência de estados sucessivos de 
um processo que possui a propriedade de que, sempre que entrar no estado i, 
então, independentemente de todos os estados passados, o próximo estado seja 


* Para uma interpretação de entropia de C*, veja o Exercício Teórico 9.18. 
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j com probabilidade P,, para todos os estados i e j. Em muitas cadeias de Mar- 
kov, a probabilidade de estar no estado j no tempo n converge para um valor 
limite que não depende do estado inicial. Se Md = 0,... M, representa esse con- 
junto de probabilidades limites, as probabilidades que formam esse conjunto 
são a única solução das equações 


M 
m= SomPi j=0,..,M 
i= 
M 
Lm=1 
j=1 


Além disso, 7, é igual à proporção de tempo a longo prazo no qual a cadeia fica 
no estado j. 

Suponha que X seja uma variável aleatória que recebe um de n possíveis 
valores de acordo com o conjunto de probabilidades (p,....,p,). A grandeza 


n 
H(X) = — 5 pilogo(pi) 
i=1 
é chamada de entropia de X. Ela pode ser interpretada como a quantidade mé- 
dia de incerteza que existe com relação ao valor de X, ou como a informação 
média recebida quando X é observado. A entropia tem importantes implica- 
ções na codificação binária de X. 


PROBLEMAS E EXERCÍCIOS TEÓRICOS 


9,1 Clientes chegam em um banco a uma taxa dade de que ele não seja atropelado se ele 


A de Poisson. Suponha que dois clientes 

tenham chegado durante a primeira hora. 

Qual é a probabilidade de que 

(a) ambos tenham chegado durante os 
primeiros 10 minutos? 

(b) pelo menos um tenha chegado duran- 
te os primeiros 10 minutos? 


9.2 Carros atravessam certo ponto em uma ro- 


dovia de acordo com um processo de Pois- 
son com taxa À = 3 por minuto. Se Paulo 
atravessa a rodovia sem olhar para os lados, 
qual é a probabilidade de que ele não seja 
atropelado se o tempo necessário para que 
ele atravesse a rodovia seja s segundos? 
(Suponha que ele será atropelado se esti- 
ver na rodovia quando um carro passar.) 
Faça este exercício para s = 2,5, 10,20. 


levar s segundos para atravessar a rodovia? 
Faça este exercício para s = 5,10,20,30. 


9.4 Suponha que 3 bolas brancas e 3 bolas 


pretas sejam distribuídas entre duas urnas 
de forma tal que cada urna contenha 3 bo- 
las. Dizemos que o sistema está no estado 
i se a primeira urna contém i bolas bran- 
cas, i = 0,1,2,3. Em cada rodada, 1 bola é 
retirada de cada urna. A bola retirada da 
primeira urna é colocada na segunda urna 
e vice-versa. Suponha que X, represente o 
estado do sistema após a n-ésima rodada 
e compute as probabilidades de transição 
da cadeia de Markov [X,,n = 0). 


9.5 Considere o Exemplo 2a. Se há uma 


chance de 50% de chover hoje, calcule a 
probabilidade de que chova daqui a três 


9.3 Suponha que, no Problema 9.2, Paulo seja 
ágil o suficiente para escapar de um único 
carro, mas não de dois. Qual é a probabili- 


diassea=0,7eB=0,3. 
9.6 Calcule as probabilidades limites para o 
modelo do Problema 9.4. 
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9.7 Uma matriz de transição de probabilidades 
é chamada de duplamente estocástica se 


M 
Se Ppel 
i=0 


para todos os estados j = 0,1...., M. Mos- 
tre que, se essa cadeia de Markov é ergó- 
dica, então H, =1(M+1),;=0,1,.,M. 
9.8 Em certo dia, Sara está de bom humor (c), 
mais ou menos (s) ou de mau humor (g). Se 
hoje ela está de bom humor, então amanhã 
ela estará c,s, ou g com respectivas proba- 
bilidades 0,7, 0,2 e 0,1. Se hoje ela está mais 
ou menos, então amanhã ela estará c,s, ou 

g com respectivas probabilidades 0,4, 0,3 e 

0,3. Se hoje ela está mal-humorada, então 

amanhã ela estará c,s, ou g com respectivas 

probabilidades 0,2, 0,4 e 0,4. Que propor- 
ção de tempo Sara está bem-humorada? 
9.9 Suponha que a possibilidade de chuva no 

próximo dia dependa somente das con- 
dições de tempo nos dois dias anteriores. 
Especificamente, suponha que, se choveu 
ontem e hoje, então amanhã choverá com 
probabilidade 0,8; se choveu ontem mas 
não hoje, então amanhã choverá com 
probabilidade 0,3; se choveu hoje mas 
não ontem, então choverá amanhã com 
probabilidade 0,4; e se não choveu nem 
ontem, nem hoje, então choverá amanhã 
com probabilidade 0,2. Em que propor- 
ção de dias há chuva? 

9.10 Certa pessoa pratica corrida todas as ma- 
nhãs. Ao deixar sua casa para a corrida 
matinal, ela tem a mesma probabilidade 
de sair pela porta da frente ou dos fundos. 
Da mesma maneira, ao voltar, ela tem a 
mesma probabilidade de entrar pela porta 
da frente ou dos fundos. À corredora pos- 
sui 5 pares de sapatos de corrida, os quais 
ela retira assim que entra em casa, não im- 
portando por qual porta entre. Se não há 
sapatos na porta por onde ela sai de casa 
para correr, então ela corre descalça. Que- 
remos determinar a proporção de tempo 
na qual a corredora corre descalça. 

(a) Formule este problema como uma ca- 
deia de Markov. Forneça os estados e 
as probabilidades de transição. 

(b) Determine a proporção de dias em 
que ela corre descalça. 


9.11 Este problema se refere ao Exemplo 2f. 

(a) Verifique que o valor proposto de TJ, 
satisfaz as equações necessárias. 

(b) Para qualquer molécula dada, o que 
você pensa a respeito da probabilidade 
(limite) de que ela esteja na urna 1? 

(c) Você acha que os eventos em que a 
molécula j, | = 1, fica na urna 1 por 
um longo tempo seriam independen- 
tes (no limite)? 

(d) Explique por que as probabilidades 
limites são aquelas fornecidas. 

9.12 Determine a entropia da soma que se ob- 
tém quando um par de dados honestos é 
jogado. 

9.13 Prove que, se X pode assumir qualquer 
um dos n valores possíveis com respecti- 
vas probabilidades P,...., P,, então H(X) é 
maximizada quando P, = 1/n,i = 1....,n. 
H(X) é igual a que neste caso? 

9.14 Joga-se um par de dados honestos. Seja 


x - |1 seasoma dos dados é 6 
“ |O caso contrário 


e suponha que Y é igual ao valor do pri- 
meiro dado. Calcule (a) H(Y), (b) HMX) 
e (c) H(X, Y). 

9.15 Uma moeda com probabilidade p = 3 de 
dar cara é jogada 6 vezes. Calcule a entro- 
pia do resultado desse experimento. 

9.16 Uma variável aleatória pode assumir 
qualquer um de n valores possíveis x,,..., 
x, com respectivas probabilidades p(x,), i 
= 1,...,n. Vamos tentar determinar o va- 
lor de X fazendo uma série de questões, 
para as quais as respostas são do tipo 
“sim” ou “não” Por exemplo, podemos 
perguntar “X é iguala x,?” ou “X é igual 
a x,,X, OU x;?)e assim por diante. O que 
você pode dizer sobre o número médio 
de questões desse tipo que você precisa- 
rá fazer para determinar o valor de X? 

9.17 Mostre que, para qualquer variável alea- 
tória X e qualquer função f, 


EGO) = HO) 


9.18 Ao transmitir um bit do ponto 4 para o 
ponto B,se fizermos com que X represen- 
te o valor do bit enviado e Y, o valor do 
bit recebido, então H(X) —- HÁX) é a taxa 
de transmissão de informação de A para B. 


Capítulo 9 » Tópicos Adicionais em Probabilidade 515 


A taxa de transmissão máxima, em função 
de P(X=1]=1-P(X = 0),é chamada de 
capacidade de canal. Mostre que, para um 
canal binário simétrico com PfY = 1|X = 


W=P[Y=0X=0)=p,a capacidade de 
canal é atingida pela taxa de transmissão 
de informação quando P[X = 1] = i e seu 
valoré1 + plogp + (1-p)log(1 — p). 


PROBLEMAS DE AUTOTESTE E EXERCÍCIOS 


9.1 Eventos ocorrem de acordo com um pro- 


cesso de Poisson com taxa À = 3 por hora. 

(a) Qual é a probabilidade de que ne- 
nhum evento ocorra entre 8 e 10 da 
manhã? 

(b) Qual é o valor esperado do número 
de eventos que ocorrem entre 8 e 10 
da manhã? 

(c) Qual é a hora de ocorrência esperada 
do quinto evento após as 14:00? 


9.2 Clientes chegam em determinada loja de 


acordo com um processo de Poisson com 

taxa À por hora. Suponha que dois clientes 

cheguem durante a primeira hora. Deter- 

mine a probabilidade de que 

(a) ambos cheguem nos primeiros 30 mi- 
nutos; 

(b) pelo menos um chegue nos primeiros 
20 minutos. 


9.3 Quatro em cada cinco caminhões em 


uma estrada são seguidos por um carro, 
enquanto um em cada seis carros é segui- 
do por um caminhão. Que proporção de 
veículos na estrada é de caminhões? 


REFERÊNCIAS 
Seções 9.1 e 9.2 


9.4 O tempo em certa cidade é classificado 


como chuvoso, ensolarado ou encoberto. 
Se um dia está chuvoso, então tem-se a 
mesma probabilidade de que o próximo 
dia seja ensolarado ou encoberto. Se não 
está chuvoso, então há uma chance em 
três de que o tempo permaneça como 
está no próximo dia, e, se o tempo mudar, 
então tem-se a mesma probabilidade de 
que ele mude para qualquer um dos ou- 
tros dois estados. A longo prazo, qual é a 
proporção de dias ensolarados? Qual é a 
proporção de dias chuvosos? 


9.5 Suponha que X seja uma variável alea- 


tória que assuma 5 valores possíveis com 

respectivas probabilidades 0,35, 0,2, 0,2, 

0,2 e 0,05. Além disso, seja X uma variável 

aleatória que assuma 5 valores possíveis 

com respectivas probabilidades 0,05, 0,35, 

0,1,0,15 e 0,35. 

(a) Mostre que H(X) > HOY). 

(b) Usando o resultado do Problema 9.13, 
forneça uma explicação intuitiva para 
a desigualdade acima. 
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Capítulo 


Simulação 1 O 


10.1 INTRODUÇÃO 


10. 3 SIMULAÇÕES APARTIR DE “DISTRIBUIÇÕES DISCRETAS 


10. 4 TÉCNICAS] De REDUÇÃO DE VARIÂNCIA s 


10.1 INTRODUÇÃO 


Como podemos determinar a probabilidade de ganharmos uma partida de pa- 
ciência jogada com um baralho de 52 cartas? Uma abordagem possível seria 
começar com a hipótese razoável de que todos os 52! arranjos de cartas possí- 
veis tenham a mesma probabilidade de ocorrência, e então tentar determinar 
quantos desses arranjos resultam em vitórias. Infelizmente, parece não haver 
um método sistemático que permita a determinação do número de arranjos que 
resultem em vitórias, e 52! é um número bastante grande. Como a única maneira 
de determinarmos se um determinado arranjo de cartas levaria a uma vitória ou 
não seria jogar uma partida, vemos que a abordagem proposta não funciona. 

De fato, parece que a determinação da probabilidade de vencermos uma 
partida de paciência é matematicamente intratável. Entretanto, nem tudo está 
perdido, pois a probabilidade não transita somente na área da matemática, mas 
também na área da ciência aplicada; e, como em todas as ciências aplicadas, a 
realização de experimentos é uma técnica valiosa. Em nosso exemplo da pa- 
ciência, experimentos podem ser realizados jogando-se um grande número de 
jogos ou, melhor ainda, programando-se um computador para fazer isso. Após, 
digamos, n jogos terem sido jogados, se fizermos 


x= 1 sea i-ésima partida resultar em vitória 
O caso contrário 


então X, = 1...., n serão variáveis aleatórias de Bernoulli independentes para 
as quais 


E(X,) = Pfvitória na paciência) 
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Portanto, pela lei forte dos grandes números, sabemos que 


3 X; número de partidas vencidas 
tn “número de partidas jogadas 
i= 


convergirá, com probabilidade 1, para P[vencer na paciência). Isto é, ao jogar um 
grande número de jogos, podemos usar a proporção de jogos vencidos como uma 
estimativa para a probabilidade de vitória. Este método empírico que determina 
probabilidades por meio de experimentos é conhecido como simulação. 

Para iniciar um trabalho de simulação no computador, precisamos gerar 
uma variável aleatória uniforme no intervalo (0, 1); tais variáveis são chamadas 
de números aleatórios. Para isso, a maioria dos computadores possui uma sub- 
rotina interna chamada de gerador de números aleatórios, cuja saída é uma se- 
quência da números pseudoaleatórios - uma sequência de números que é, para 
todos os efeitos, impossível de se distinguir de uma amostra da distribuição 
uniforme no intervalo (0, 1). A maioria dos geradores de números aleatórios 
começa com um valor inicial X,, chamado de semente, e então especifica intei- 
ros positivos a, c e m e faz cálculos recursivos usando 


Xu = (aX, + c) módulo m nz0 (1.1) 


onde a expressão acima significa que o termo aX, + c é dividido por m, sendo 
o resto da operação atribuído a X, ,, Assim, cada X, é iguala 0,1,...,m-— 1,e se 
supõe que a grandeza X,/m seja uma aproximação para uma variável aleatória no 
intervalo (0, 1). Pode-se mostrar que, desde que escolhas adequadas sejam feitas 
para a, c e m, a Equação (1.1) dá origem a uma sequência de números que pare- 
cem ter sido gerados a partir de variáveis aleatórias uniformes no intervalo (0, 1). 

Como ponto de partida, vamos supor que podemos simular uma distribui- 
ção uniforme no intervalo (0, 1) e usar o termo números aleatórios para repre- 
sentar as variáveis aleatórias dessa distribuição. 

No exemplo da paciência, precisaríamos programar o computador para jo- 
gar cada partida começando com uma dada sequência de cartas. Entretanto, 
como se supõe que a sequência inicial possa ser, com mesma probabilidade, 
qualquer uma das 52! permutações possíveis, também é necessário gerar uma 
permutação aleatória. Usando somente números aleatórios, o algoritmo a se- 
guir mostra como fazer isso. O algoritmo começa escolhendo aleatoriamente 
um dos elementos e depois coloca-o na posição n; em seguida, ele escolhe ale- 
atoriamente um dos elementos restantes e coloca-o na posição n — 1, e assim 
por diante. O algoritmo faz uma escolha aleatória eficiente entre os elementos 
restantes mantendo esses elementos em uma lista ordenada e então escolhen- 
do aleatoriamente uma posição na lista. 


Exemplo 1a 


Suponha que queiramos gerar uma permutação dos inteiros 1, 2...., n tal que 
todas as n! sequências possíveis sejam igualmente prováveis. Então, começan- 
do com qualquer permutação inicial, faremos isso em um total de n — 1 passos; 
em cada passo, promoveremos o intercâmbio de dois dos números da permu- 
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tação. Ao longo do processo, vamos acompanhar a permutação fazendo com 
que X(i), i = 1,...,n represente o número atualmente na posição i. O algoritmo 
opera da seguinte maneira: 


1. Considere qualquer permutação arbitrária e suponha que X(i) represente 
o elemento na posição i, i = 1,...,n [por exemplo, poderíamos usar X(i) = i, 
i=1,...,n). 

2. Gere uma variável aleatória N, que seja igual a qualquer um dos valores 1, 
2,...,n com mesma probabilidade. 

3. Faça o intercâmbio dos valores de X(N,) e X(n). O valor de X(n) agora 
ficará fixo [por exemplo, suponha que n = 4 e inicialmente X(i) = ii =, 
2,3,4.Se N, = 3, então a nova permutação é X(1) = 1, X(2) = 2, X(3) = 4, 
X(4) = 3,e o elemento 3 ficará na posição 4 ao longo de todo o processo]. 

4. Gere uma variável aleatória N, , que tenha a mesma probabilidade de ser 
iguala 1,2,...,n-1. 

5. Realize o intercâmbio dos valores de X(N, ))e X(n— 1) [se N, = 1, então a 
nova permutação é X(1) = 4,X(2) = 2,X(3) = 1, X(4) = 3]. 

6. Gere N, », que tem a mesma probabilidade de ser igual a 1,2,...,n —2. 

7. Faça o intercâmbio dos valores X(N, ,) e X(n — 2). [Se N, = 1, então a nova 
permutação é X(1) = 2, X(2) = 4, X(3) = 1, X(4) = 3,e esta é a permutação 
final.] 

8. Gere N, , e assim por diante. O algoritmo continua até que N, seja gerado, 
e após o último intercâmbio a permutação resultante é a permutação final. 


Para implementar esse algoritmo, é necessário gerar uma variável aleatória 
que tenha a mesma probabilidade de assumir qualquer um dos valores 1,2...., 
k. Para fazer isso, suponha que U represente um número aleatório — isto é, U é 
uniformemente distribuído no intervalo (0, 1) — e observe que KU é uniforme 
em (0, k). Portanto, 


Pfi>1<kU <D=; = cos 


assim, se escolhermos N, = [kU] + 1, onde [x] é a parte inteira de x (isto é,o 
maior número inteiro menor ou igual a x), então N, terá a distribuição desejada. 
O algoritmo pode agora ser escrito sucintamente como: 


Passo 1. Seja X(1),..., X(n) qualquer permutação de 1,2,...,n [por exem- 
plo, podemos fazer X(i) = i,i=1.,...,n]. 

Passo 2. Faça] =n. 

Passo 3. Gere um número aleatório U e faça N = [IU] + 1. 

Passo 4. Faça o intercâmbio dos valores de X(N) e X(J). 

Passo 5. Subtraia 1 do valor fe,se 1 > 1, vá para o passo 3. 

Passo 6. X(1),..., X(n) é a permutação aleatória desejada. 


O algoritmo anterior para a geração de uma permutação aleatória é ex- 
tremamente útil. Por exemplo, suponha que um estatístico realize um experi- 
mento no qual compara o efeito de m diferentes tratamentos em um conjunto 
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de n diferentes cobaias. Ele decide separar as cobaias em m diferentes grupos 
de respectivos tamanhos 1, n,,..., n,, onde 5, n; = n, com os membros do 
i-ésimo grupo recebendo o tratamento i. Para eliminar qualquer possibilidade 
de desequilíbrio na escolha das cobaias para os tratamentos (por exemplo, se 
todas as “melhores” cobaias forem colocadas no mesmo grupo, isso afetará o 
significado dos resultados experimentais), é imperativo que a distribuição das 
cobaias entre os grupos seja feita “aleatoriamente” Como isso pode ser feito?” 

Um procedimento simples e eficiente é numerar as cobaias 1 a n e então 
gerar uma permutação aleatória X(1)...., X(n) de 1,2....,n. Depois, coloca- 
mos as cobaias X(1), X(2),..., X(n,) no grupo 1, X(n, + 1)...., X(n, + n,) no 
grupo 2, e, em geral, o grupo ; fica sendo formado pelas cobaias numeradas 


X(n, + n, +... + HR Lust [a] 


10.2 TÉCNICAS GERAIS PARA SIMULAR VARIÁVEIS 
ALEATÓRIAS CONTÍNUAS 


Nesta seção, apresentamos dois métodos gerais que permitem o uso de núme- 
ros aleatórios para simular variáveis aleatórias contínuas. 


10.2.1 O método da transformação inversa 
Um método geral para simular uma variável aleatória com distribuição contínua, 
chamado de método da transformação inversa, baseia-se na seguinte proposição. 


Proposição 2.1 Seja U uma variável aleatória uniforme no intervalo (0,1). Para 
qualquer distribuição contínua F, se definirmos a variável aleatória Y como 
y=F“U) 
então Y tem função distribuição F [define-se F”(x) como sendo o valor de y 
para o qual F(y) = x]. 
Demonstração 
Fy(a) =PlY <a) 
=P(F HU) <a) (2.1) 
Agora, como F(x) é uma função monotônica, F “(U) = a se e somente se 
U = F(a). Portanto, da Equação (2.1), temos 
Fy(a) = P(U = F(a)) 
= F(a) O 


Resulta da Proposição 2.1 que, para simular uma variável aleatória X com uma 
distribuição contínua F, geramos um número aleatório U e fazemos X = F'(U). 


* Outra técnica para dividir aleatoriamente as cobaias quando m = 2 foi apresentada no 
Exemplo 2g do Capítulo 6. O procedimento desta seção é mais rápido, mas requer mais 
espaço do que aquele do Exemplo 2g. 


Capítulo 10 e Simulação 521 


Exemplo 2a Simulando uma variável aleatória exponencial 
Se F(x) = 1-e”, então F '(u) é o valor de x tal que 


l-e*=u 
ou 


x=-log(l — u) 
Portanto, se U é uma variável aleatória uniforme no intervalo (0, 1), então, 
F4U)= —log(d — U) 


é exponencialmente distribuída com média 1. Como 1 — U também é unifor- 
memente distribuída em (0, 1), tem-se que “log U é exponencial com média 1. 
Como cX é exponencial com média c quando X é exponencial com média 1, 
tem-se que —c log U é exponencial com média c. n 


Os resultados do Exemplo 2a também podem ser utilizados para simular 
uma variável aleatória gama. 


Exemplo 2b Simulando uma variável aleatória gama (n, À) 

Para simular uma distribuição gama com parâmetros (n,A) quando n é inteiro, 
usamos o fato de que a soma de n variáveis aleatórias exponenciais, cada uma 
delas com taxa À, possui essa distribuição. Portanto, se U,,..., U, são variáveis 
aleatórias independentes e uniformes no intervalo (0,1), então 


n 


1 1 a 
Ee Rebis e o Hu 


possui a distribuição desejada. = 


10.2.2 O método da rejeição 

Suponha que tenhamos um método para simular uma variável aleatória com fun- 

ção densidade g(x). Podemos usar esse método como base para simular uma distri- 

buição contínua com densidade f(x) fazendo a simulação de Y a partir de g e então 

aceitando o valor simulado com uma probabilidade proporcional a (Y)/g(Y). 
Especificamente, seja c uma constante tal que 


0) 


—— <c paratodoy 


80) 
Temos a seguinte técnica para simular uma variável aleatória com densidade f. 
Método da rejeição 


Passo 1. Simule Y com densidade g e simule um número aleatório U. 
Passo2. SeU=fY)cg(Y), faça X = Y. Do contrário, retorne ao passo 1. 
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O método da rejeição é expresso graficamente na Figura 10.1. Vamos agora 
demonstrar que ele funciona. 


Proposição 2.2 A variável aleatória X gerada pelo método da rejeição possui 
função densidade f. 


Demonstração Seja X o valor obtido e suponha que N represente o nú- 
mero de iterações necessárias. Então 


PX <x)=P(Yy sas) 
=PjysuUs IO) | 


cg(Y) 
cs 0 
au us 9) 
= K 


onde K = P[U = f(Y)/cg(Y)]. Agora, pela independência, a função densi- 
dade conjunta de Y e U é 


fou)=80) 0O<u<l 
Assim, temos 


1 
PX <x)= X E g() dudy 
ySx 


O =u=f0)/cg0) 


1 (fogo) E 
=% f a A dug) dy 
1 XxX 
ERA d 
cK f.s sy (2.2) 


Fazendo X — o e usando o fato de que f é uma função densidade, obtemos 


1 fo 1 
=) SOd= 


Portanto, da Equação (2.2), obtemos 
x 
Pr =a=[ fo 
—co 


o que completa a demonstração. U 


Início 


Gere um 
número aleatório 
U 


Gere 
sie: 


Figura 10.1 Método da rejeição para simular uma variável aleatória X com fun- 
ção densidade f. 
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Observações: (a) Note que, para “aceitar o valor Y com probabilidade 
HW)cg(Y); geramos um número aleatório U e aceitamos Y se U = H(Y)/cg(Y). 
(b) Como cada iteração resultará independentemente em um valor aceito 
com probabilidade P(U = H(Y)/cg(Y))] = K = 1/c, tem-se como consequência 
que o número de iterações possui distribuição geométrica com média c. E 


Exemplo 2c Simulando uma variável aleatória normal 

Para simularmos uma variável aleatória normal unitária (isto é, uma variável 
normal com média O e variância 1), note primeiro que o valor absoluto de Z 
tem função densidade de probabilidade 


2 2 
Eee na E) 
fl) E <x<o (2.3) 


Vamos começar com uma simulação a partir dessa função densidade usando 
o método da rejeição, com g sendo a função densidade exponencial com 
média 1 — isto é, 


x 


gO)=e*? 0O<x<o 


Agora, observe que 


—(x — 
to PoE =] 


go) x p 2 
- (2ex =-(W-u+10) 1 
mo P 2 2 
— Pe =(x — 1)? 
- eo] 


E E (2.4) 


Com isso, podemos considerar c = 2e/r; então, da Equação (2.4), 


fO cole 
ca) PPT 


Portanto, usando o método da rejeição, podemos simular o valor absoluto de 
uma variável aleatória normal unitária da seguinte forma: 


(a) Gere variáveis aleatórias independentes Y e U, sendo Y exponencial com 
taxa 1 e U uniforme no intervalo (0, 1). 


(b) SeU = exp(-(Y - 1)2), faça X = Y. Do contrário, retorne para (a). 


Assim que simularmos uma variável aleatória X tendo como função densidade 
a Equação (2.3), poderemos gerar uma variável aleatória normal unitária Z 
fazendo com que Z tenha a mesma probabilidade de ser iguala X ou -X. 
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No passo (b), o valor Y é aceito se U = exp[—(Y — 1)'2), o que é equiva- 
lente a log U = (Y-1)/2. Entretanto, no Exemplo 2a mostrou-se que —logU é 
exponencial com taxa 1. Com isso, os passos (a) e (b) são equivalentes a 


(a”) Gere exponenciais independentes Y, e Y,, cada um com taxa 1. 
(b”) Se Y,= (Y,-1)/2, faça X = Y,. Caso contrário, retorne para (a”). 


Suponha agora que os passos anteriores resultem na aceitação dos Y,'s — então 
saberemos que Y, é maior que (Y, — 1)/2. Mas quantas vezes uma variável é 
maior do que a outra? Para responder a essa questão, vamos lembrar que Y, 
é exponencial com taxa 1; portanto, dado que ela exceda algum valor, o tanto 
que Y, é maior que (Y, — 1)72 [isto é, sua “vida adicional” além do tempo (Y, 
— 1)/2] também é (pela propriedade da falta de memória) exponencialmen- 
te distribuído com taxa 1. Isto é, quando aceitamos o passo (b”), não somente 
obtemos X (o valor absoluto de uma normal unitária), mas, computando Y, — 
(Y, - 1)'/2, também podemos gerar uma variável aleatória exponencial (que é 
independente de X) com taxa 1. 

Em resumo, temos o seguinte algoritmo que gera uma variável aleatória ex- 
ponencial com taxa 1 e uma variável aleatória normal unitária independente. 


Passo 1. Gere Y,, uma variável aleatória exponencial com taxa 1. 

Passo 2. Gere Y,, uma variável aleatória exponencial com taxa 1. 

Passo3. SeY,-(Y,-1)/2>0,façaY = Y,— (Y,-1)/2e vá para o passo 4. 
Caso contrário, vá para o passo 1. 

Passo 4. Gere um número aleatório U e faça 


Y. < 
Z- qse U 
—Yi se U > 


Opa NI 


As variáveis aleatórias Z e Y geradas por esse algoritmo são independen- 
tes, com Z normal com média O e variância 1,e Y exponencial com taxa 1 (se 
desejarmos uma variável aleatória normal com média q e variância o”, simples- 
mente fazemos yu + 0Z). 

Observações: (a) Comoc = V2e/x = 1,32,0 algoritmo requer um nú- 
mero geometricamente distribuído de iterações no passo 2 com média 1,32. 

(b) Se quisermos gerar uma sequência de variáveis aleatórias normais unitá- 
ria, então podemos usar a variável aleatória exponencial Y obtida no passo 3 como 
a exponencial inicial necessária no passo 1 para gerar a próxima normal. Portanto, 
em média, podemos simular uma normal unitária gerando 1,64(= 2 x 1,32 -1) 
exponenciais e calculando 1,32 quadrados. o 


Exemplo 2d Simulando variáveis aleatórias normais: o método polar 


Foi mostrado no Exemplo 7b do Capítulo 6 que, se X e Y são variáveis alea- 
tórias normais independentes unitárias, então suas coordenadas polares 
R=vVX2+Y2e0=tg!(Y/X) são independentes, sendo Rº exponencial- 
mente distribuída com média 2, e O uniformemente distribuída em (0,27%). Por- 
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tanto, se U, e U, são números aleatórios, então, usando o resultado do Exemplo 
2a, podemos fazer 


R=(-2lgU))!? 
O =27U, 


de onde resulta que 


X = RcosO = (-2log U)!? cos(27 Us) 
Y=RsenO = (-2log U,)!? sen(2x Us) (2.5) 


são variáveis aleatórias normais unitárias independentes. = 


Esta é a chamada abordagem de Box-Muller. Sua eficiência sofre um pou- 
co da necessidade de se fazer o cálculo de senos e cossenos. Há, no entanto, 
uma maneira de se evitar essa potencial dificuldade, que pode resultar em um 
aumento relativo do tempo de simulação. Para começar, observe que, se U é 
uniforme em (0, 1), então 2U é uniforme em (0,2). Assim, 2U — 1 é uniforme em 
(—1,1). Logo, se gerarmos os números aleatórios U, e U, e fizermos 


V/=2U, — 1 
V49=2U, —-1 


então o par (V,, V,) é uniformemente distribuído no quadrado de área 4 centra- 
do em (0,0) (veja a Figura 10.2). 

Suponha agora que geremos continuamente pares (V,, V,) até que obte- 
nhamos um que esteja contido no disco de raio 1 centrado em (0, 0) — isto é, 
até que vz + vz = 1. Tem-se então como consequência que tal par (V,, V,) é 
uniformemente distribuído no disco. Agora, suponha que R e O representem as 


(1,1) (1,1) 


(-1,-1) dO ] (1,-1) 


Figura 10.2 


526 Probabilidade: Um Curso Moderno com Aplicações 


coordenadas polares deste par. Nesse caso é fácil verificar que R e O são inde- 
pendentes, sendo Rº uniformemente distribuído em (0, 1) e O uniformemente 
distribuído em (0, 27) (veja o Problema 10.13). 


Como 
-V V. 
nO SS 
R MA+AV 
-V V. 
cosO = as À 


R 2 2 
VV + V5 
resulta da Equação (2.5) que podemos gerar as variáveis aleatórias normais uni- 
tárias independentes X e Y gerando um outro número aleatório U e fazendo 
X =(-2l0gU)!2V;/R 
Y = (-2log U)/2v,/R 


De fato, como (condicionado a V2 + Ve < 1) Rº é uniforme em (0,1) e inde- 
pendente de 9, podemos usar essá Janiável para gerar um novo número aleató- 
rio U, o que mostra que 


2102V1 —2log $ 
X=(-2] = = V 
(-2log R) R V s 1 
221/2 V. —2log $ 
(-2logR) R y s 2 


são variáveis aleatórias normais unitárias independentes, onde 


s=R=Vi+V2 


Em resumo, temos a seguinte abordagem para gerar um par de variáveis alea- 
tórias normais unitárias independentes: 


Passo 1. Gere os números aleatórios U, e U,. 

Passo2. FaçaVi; =2U, — 1,V2=2U, — 1,S=VZ + VZ. 

Passo 3. SeS>1,retorne ao passo 1. 

Passo 4. Retorne as variáveis aleatórias normais unitárias independentes 


—2log $ —2log $ 
= V5Y=/———V 
x S 1, VOS 2 


Esse algoritmo é chamado de método polar. Como a probabilidade de 
que um ponto aleatório no quadrado caia no interior do círculo é igual a 7/4 
(a área do círculo dividida pela área do quadrado), tem-se que, na média, o 
método polar requer 4/m = 1,273 iterações no passo 1. Com isso, em média, 
ele requererá 2,546 números aleatórios, 1 logaritmo, 1 raiz quadrada, 1 divi- 
são e 4,546 multiplicações para gerar 2 variáveis aleatórias normais unitárias 
independentes. 
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Exemplo 2e Simulando uma variável aleatória qui-quadrado 


A distribuição qui-quadrado com n graus de liberdade é a distribuição de 

x2 = Z ao tceuia ato Ze onde Z, i = 1,...n são variáveis aleatórias normais uni- 

tárias independentes. Agora lembre que, da Seção 6.3 do Capítulo 6, Z + zo 
1 


possui distribuição exponencial com taxa 5. Portanto, quando n é par (diga- 


mos, n = 2k), A possui distribuição gama com parâmetros (k, 1), Assim, 


-2og TE, U;) possui distribuição qui-quadradó com 2k graus de liberdade. 
Da mesma forma, podemos simular uma variável aleatória qui-quadrado com 
2k + 1 graus de liberdade primeiro simulando uma variável aleatória normal 
unitária Z e depois somando Zº à expressão anterior. Isto é, 


k 


Xi = 2º — 2log HH Ui 
i=1 


onde Ze U,...., U, são independentes [Z é uma variável aleatória normal unitá- 
riae U,..,U, são variáveis aleatórias uniformes no intervalo (0, 1)]. 


10.3 SIMULAÇÕES A PARTIR DE DISTRIBUIÇÕES DISCRETAS 


Todos os métodos gerais para simular variáveis aleatórias a partir de distribui- 
ções contínuas possuem análogos no caso discreto. Por exemplo, se quisermos 
simular uma variável aleatória Z com função de probabilidade 


Pad 150] RA 
j 


podemos usar o seguinte análogo da técnica da transformada inversa. 
Para simular X para a qual P(X = x) = P, suponha que U seja uniforme- 
mente distribuída ao longo de (0, 1) e faça 


x, seU <= Pj 
x» seP;<U=<P+P 


X= 


jd j 
Xj Se >.P; <Ux=< >? 
1 i 


Como 


a! j 
PX=x])=P ba SUE =P; 
1 1 


resulta que X é a distribuição desejada. 
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Exemplo 3a A distribuição geométrica 


Suponha que tentativas independentes, cada uma com probabilidade de suces- 
sop,0<p < 1, sejam continuamente realizadas até que um sucesso ocorra. 
Supondo que X represente o número necessário de tentativas, então 


PX=ij=0-p'p izl 


o que é visto notando-se que X = 1 se as primeiras i — 1 tentativas são todas 
fracassadas e a i-ésima tentativa é um sucesso. Suponha que X represente o 
número necessário de tentativas. Como 


j-1 
Pu D=d PAX Ss) 
i=1 


=1 — Plprimeiros j — 1 são fracassos) 
=1-d-p/! j=1 


podemos simular tal variável aleatória gerando um número aleatório U e então 
fazendo X igual ao valor j para o qual 


1-d-pl<us1-d-p 
ou, equivalentemente, para o qual 
= plst= 0 <= py 
Como 1 - U tem a mesma distribuição que U, podemos definir X como 
X=míngj:(d -pj=<U) 
= mín():jlog(l — p) = log U) 
=mínijij= ORE o 
“CEC ioga —p) 


onde a desigualdade muda de sinal porque log(1 — p) é negativo [pois log(1 — p) 
< log1 = 0]. Usando a notação [x] para representar a parte inteira de x (isto é, 
[x] é o maior inteiro menor ou igual a x), podemos escrever 


Como no caso contínuo, técnicas de simulação especial foram desenvol- 
vidas para as distribuições discretas mais comuns. Agora apresentamos duas 
dessas técnicas. 


Exemplo 3b Simulando uma variável aleatória binomial 


Uma variável aleatória binomial pode ser facilmente simulada se lembrarmos 
que ela pode ser expressa como a soma de n variáveis aleatórias de Bernoulh 
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independentes. Isto é,se U,,..., U, são variáveis aleatórias independentes e uni- 
formes no intervalo (0, 1) e se fizermos 
VE 1 seUi <p 
' O caso contrário 


n 
resulta que X = 5) X; é uma variável aleatória binomial com parâmetros n e p. 
i=1 


Exemplo 3c Simulando uma variável aleatória de Poisson 


Para simular uma variável aleatória de Poisson com média À, gere variáveis alea- 
tórias U,, U,,... independentes e uniformes no intervalo (0,1) e pare quando 


n 
N=mín n: [Ju a 


i=1 


A variável aleatória X = N — 1 possui a distribuição desejada. Em outras pala- 
vras, se gerarmos números aleatórios continuamente até que seu produto seja 
menor que e”, então o número necessário, menos 1, é Poisson com média À. 

Que X = N-1 é de fato uma variável aleatória de Poisson com média À 
talvez possa ser visto mais facilmente se observarmos que 


n 
X + 1=mín n:[[u: < e 


i=1 


é equivalente a 


n 
X = máx nl = e onde Ifu=1 
i=1 i=1 


ou, usando-se logaritmos, a 


n 
X = máx n:> JogU; >-A 
i=1 


ou 


n 
X = máx n:> —logU; <A 
i=1 


Entretanto, —logU, é exponencial com taxa 1,e com isso X pode ser visto como 
o número máximo de exponenciais com taxa 1 que podem ser somadas e ainda 
assim o resultado ser menor que À. Mas lembrando que os tempos entre even- 
tos sucessivos de um processo de Poisson com taxa 1 são exponenciais indepen- 
dentes com taxa 1, resulta que X é igual ao número de eventos até o tempo À de 
um processo de Poisson com taxa 1; assim, X tem uma distribuição de Poisson 
com média À. E 
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10.4 TÉCNICAS DE REDUÇÃO DE VARIÂNCIA 


- Suponha que as variáveis aleatórias X,,..., X, possuam uma dada função distri- 
buição conjunta e suponha que estejamos interessados em calcular 


0 = Elg(X1,...,Xn)] 
onde g é alguma função específica. Às vezes sucede ser extremamente difícil 
computar 6 analiticamente, e quando este é o caso, podemos tentar estimar esse 


parâmetro por meio de uma simulação. Isso é feito da seguinte maneira: gere 
xD... xD com a mesma distribuição conjunta de X,...., X, e faça 


DD, 
N=gãD,..., xD) 


Agora, seja X DX, (2) um segundo conjunto de variáveis aleatórias (indepen- 
dente do primeiro) tendo a distribuição de X,,..., X,, e faça 


P=gu2,...,x9) 


nº 


Continue com isso até que você tenha gerado k (algum número predetermina- 
do) conjuntos e calculado Y,, Y,...., Y,. Agora, Y,,..., Y, são variáveis aleatórias 
independentes e identicamente distribuídas, cada uma com a mesma distribui- 
ção de g(X,...., X,). Logo, se Y representa a média dessas k variáveis aleatórias 
— isto é, se 


então 
E[Y] = 6 
ELY — 9) = Var(Y) 


Portanto, podemos usar Y como uma estimativa de 6. Como o valor esperado 
do quadrado da diferença entre Y e 6 é igual à variância de Y, é interessante 
a Es 
que essa grandeza tenha o menor valor possível [no caso estudado, Var(Y) = 
Var(Y)/k, o que usualmente não se sabe de antemão mas pode ser determina- 
do a partir dos valores gerados Y,,..., Y,). Agora, apresentamos três técnicas 

gerais que permitem reduzir a variância de nosso estimador. 


10.4.1 Uso de variáveis antitéticas 
Na situação anterior, suponha que tenhamos gerado Y, e Y,, que são variáveis 
aleatórias identicamente distribuídas com média 0. Agora, 
Y yY, 1 
Var (25) = q[Var(Yy) + Var(Y3) + 2Cov(h, Y9)] 
Var(Y1) Cov(Y14, Y2) 
SEE ed 2 
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Com isso, seria vantajoso (no sentido de reduzir-se a variância) que Y, e Y, 
fossem negativamente correlacionadas em vez de serem independentes. Para 
ver como podemos fazer isso, suponhamos que as variáveis aleatórias X,,..., X, 
sejam independentes e, além disso, que cada uma delas seja simulada por meio 
da técnica da transformada inversa. Isto é, X, é simulada a partir de F; (U)), 
onde U, é um número aleatório e F, é a distribuição de X,. Logo, Y, pode ser 
expressa como 


Y1 = 87 HUy),..., Fr; MUm) 


Agora, como 1 — U também é uniforme em (0, 1) sempre que U é um núme- 
ro aleatório (e negativamente correlacionada com U), resulta que Y, definida 
como 


Y=g(Fra — Uy,...o Fi — Um) 


terá a mesma distribuição de Y,. Com isso, se Y, e Y, são negativamente cor- 
relacionadas, a geração de Y, por meio desse procedimento leva a uma menor 
variância do que aquela que teríamos se essa variável aleatória fosse gerada a 
partir de um novo conjunto de números aleatórios (além disso, há reduções no 
tempo computacional associado, porque em vez de gerar n números aleatórios 
adicionais, precisamos apenas subtrair de 1 cada um dos n números anteriores). 
Embora não possamos, em geral, assegurar que Y, e Y, sejam negativamente 
correlacionadas, frequentemente este é o caso, e, de fato, pode-se demonstrar 
que isso ocorrerá sempre que g for uma função monotônica. 


10.4.2 Redução da variância usando condições 


Vamos começar relembrando a fórmula da variância condicional (veja a Seção 
15.4): 


Var(Y) = E[Var(Y|2)] + Var(E[Y|Z]) 


Agora, suponha que estejamos interessados em estimar Elg(X,,..., X,)] primei- 
ro simulando X = (X,,..., X,) e depois calculando Y = g(X). Se, para alguma va- 
riável aleatória Z, pudermos calcular E[Y|Z], então, como Var(Y|Z) = 0, resulta 
da fórmula da variância condicional que 


Var(E[Y|Z) = Var(Y) 


Assim, como E[E[Y|Z]] = E[Y], resulta que E[Y|Z] é um melhor estimador de 
E[Y] do que Y. 


Exemplo 4a Estimação de 7 

Suponha que U, e U, sejam números aleatórios, e faça V, = 2U,-1,i = 1,2. 
Como notado no Exemplo 2d, o par (V,, V,) estará uniformemente distri- 
buído no quadrado de área 4 centrado em (0,0). A probabilidade de que este 
ponto caia no interior do círculo inscrito de raio 1 centrado em (0,0) (veja a 
Figura 10.2) é igual a 7/4 (a relação entre as áreas do círculo e do quadrado). 
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Portanto, simulando um grande número n de pares com essas características 
e fazendo 


fã 1 seoj-ésimo par cair no interior do círculo 
1" 10 caso contrário 


resulta que 7,j = 1,...,n, serão variáveis aleatórias independentes e identica- 
mente distribuídas com E[1,)] = 7/4. Assim, pela lei forte dos grandes números, 
h+e+h x 
———— > — quando n->00 
n 4 
Portanto, simulando um grande número de pares (V,, V,) e multiplicando por 
4a proporção destes que caem no interior do círculo, podemos estimar 7 com 
boa precisão. 
Esse estimador pode, no entanto, ser melhorado com o uso da esperança 
condicional. Se 1 for a variável indicadora do par (V,, V,), então, em vez de usar 
o valor observado de T, é melhor condicionar em V, e utilizar 


EUIVi) = P(VE + VÊ =11V1) 
=P(VZ=<1- VIVI) 
Agora, 
P(V)=1- VHVi=v)=P(V; = 


Las] 
À 
pa 
| 
= 
[8] 
> 


então 


E(IVi)=V1 — V? 


Assim, uma possível melhoria em relação ao uso do valor médio de [ para 
estimar 7/4 é usar o valor médio de ,/1 — Ve: De fato, como 


El1 — vil= [vi — Pav= [vi — u2du = ElvV1 — U?] 


onde U é uniforme no intervalo (0, 1), podemos gerar n números aleatórios U 


e usar o valor médio de /1 — U? como nossa estimativa para 7/4 (o Problema 
10.14 mostra que este estimador tem a mesma variância que a média dos n va- 
lores, 1 — V2). 

Esse estimador de 7 pode ser melhorado ainda mais se notarmos que a 
função g(u) = v1 — u2,0=<u < ,é uma função monotonicamente decres- 
cente de u, e com isso o método das variáveis antitéticas reduz a variância do 
estimador de E[vV1 — U?2]. Isto é, em vez de gerar n números aleatórios e usar 
o valor médio de 1 — U? como um estimador de 7/4, obteríamos um melhor 
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estimador gerando somente n/2 números aleatórios U e então usando metade 
da média de a 1-— U2+ A 1- (1 — U)? como o estimador de 7/4. 

A tabela a seguir fornece os valores de 7 obtidos a partir de simulações 
realizadas com os três estimadores usando n = 10.000. 


Método Valor estimado de 77 
Proporção de pontos aleatórios no interior do círculo 3,1662 

Valor médio de 1 — U2 3,128448 
Valor médio de 1 — U? + I —(1-U? 3,139578 


Uma simulação adicional utilizando a última abordagem e n = 64.000 resultou 
em um valor estimado de 3,143288. |] 


10.4.3 Variáveis de controle 


Novamente, suponha que queiramos usar uma simulação para estimar Elg(X)], 
onde X = (X,,..., X,). Mas suponha agora que, para alguma função f, o valor es- 
perado de f(X) seja conhecido — digamos que ele seja E[HX)] = u. Então, para 
qualquer constante a, também podemos usar 


W = g(X) + alfx) — ul 
como um estimador de Elg(X)]. Agora, 
Var(W) = VarlgO)] + &Varlf(X)] + 20 Cov[g(X),fO)] (41) 
Um pouco de cálculo elementar mostra que essa expressão é minimizada quando 


— —Cov(f O), 800] 
Var] (4.2) 


e, para esse valor de a, 
[Cov[fE), g00] 
Var[fX)] (4.3) 


Infelizmente, não é usual que conheçamos nem Var[f(X)], nem Cov[(X), g(X)], 
e portanto em geral não podemos obter uma redução na variância usando o 
método anterior. Uma abordagem que é empregada na prática consiste no uso 
de dados simulados para estimar tais grandezas. Geralmente essa abordagem 
permite a maior redução teórica possível no valor da variância. 


Var(W) = Var[g(X)] 


RESUMO 


Seja F uma função distribuição contínua, e U uma variável aleatória uniforme 
no intervalo (0, 1). Então, a variável aleatória F '(U) tem função distribuição 
F, onde F '(u) é o valor de x tal que F(x) = u. Aplicando esse resultado, pode- 
mos usar os valores de variáveis aleatórias uniformes, chamados de números 
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aleatórios, para gerar os valores de outras variáveis aleatórias. Essa técnica é 
chamada de método da transformação inversa. 

Outra técnica utilizada para gerar variáveis aleatórias baseia-se no método 
da rejeição. Suponha que tenhamos um procedimento eficiente para gerar uma 
variável aleatória a partir da função densidade g e que queiramos gerar uma 
variável aleatória com função densidade f. O método da rejeição faz isso pri- 
meiramente determinando uma constante c tal que 


mai, <c 
g(x) 


e depois segue os seguintes passos: 


1. Gera Y com densidade g. 

2. Gera um número aleatório U. 

3. SeU=fYcg(Y), faz X = Ye para. 
4. Retorna para o passo 1. 


O número de passagens pelo passo 1 é uma variável aleatória geométrica com 
média c. 

Variáveis aleatórias normais padrão podem ser simuladas eficientemente 
pelo método da rejeição (com g exponencial com média 1), ou pela técnica 
conhecida como o algoritmo polar. 

Para estimar uma grandeza 9, muitas vezes é necessário gerar os valores de 
uma sequência parcial de variáveis aleatórias cujo valor esperado é 6. A eficiên- 
cia dessa abordagem é aumentada quando tais variáveis aleatórias possuem 
uma variância pequena. Três técnicas que, com frequência, podem ser utilizadas 
para especificar variáveis aleatórias com média 9 e variâncias relativamente 
pequenas são 


1. o uso de variáveis antitéticas, 
2. o uso de esperanças condicionais, e 
3. o uso de variáveis de controle. 


PROBLEMAS 
10.1 O seguinte algoritmo gera uma permuta- Passo 4. Gere um número aleatório U 
ção aleatória dos elementos 1,2,...,n. Ele e faça 
é um pouco mais rápido do que aquele P(o = PQkU] + 1) 
apresentado no Exemplo 1a, mas é tal P ne 
do Ra ag KU] + D)=k 
que nenhuma posição é fixada até o tér- 
mino da execção. Neste algoritmo, P(i) Volte para o passo 3. 
pode ser interpretado como o elemento (a) Explique com palavras o que faz esse 
na posição i. algoritmo. 
Passol. Façak=1. (b) Mostre que na iteração k — isto é, 
Passo2. Faça P(1) = 1. quando o valor de P(k) é inicialmente 
Passo3. Sek = mn, pare. Caso contrário, ajustado — P(1), P(2),..., P(k) é uma 


façak=k+1. permutação aleatória de 1,2,...,k. 


Dica: Use indução e mostre que 


Paisio,... sir, kd, = sik-2,1) 
fab ui à asd 
= Ppralisio,..sdjpasbijp... ah 


= a pela hipótese de indução 


10.2 Desenvolva uma técnica para simular 
uma variável aleatória com função densi- 
dade 


ex -c0 <x<0 
er )<x<o 


ro=| 


10.3 Proponha uma técnica para simular uma 
variável aleatória com função densidade 
de probabilidade 


1 

id — 2) 2=<x<3 
fo) = 

0 caso contrário 


10.4 Apresente um método para simular uma 
variável aleatória com função distribuição 


0 x = —S3 
1 x 
-+>0 —3<x<0 
2 6 
F(x) = ? 
E 0O<x=<a4 
2 32 = 
1 x>4 


10.5 Use o método da transformação inversa 
para gerar uma variável aleatória a partir 
da distribuição de Weibull 


Fy)=1-€ É 1>0 


10.6 Forneça um método para simular uma va- 
riável aleatória com função taxa de falhas 
(a) AM) =; 
(b) A(1) = ct; 
(c) A(t) = cf; 
(d) A(i) = cf. 

10.7 Seja Fa função distribuição 


Fo)=% 0<x<l 
(a) Forneça um método para simular uma 


variável aleatória com distribuição F 
que use somente um número aleatório. 
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(b) Seja U,...., U, um conjunto de núme- 
ros aleatórios. Mostre que 


P(máx(U,...,Un) < x) o cá 


(c) Use a letra (b) para propor um segun- 
do método para simular uma variável 
aleatória com distribuição F. 

10.8 Suponha que seja relativamente fácil si- 
mular F, para cada i = 1,...,n. Como pode- 
mos simular a partir de 


(a) FO) = [| Fio)? 
i=1 
(b) Fo) =1 = TI — Fio] 


i= 

10.9 Suponha que tenhamos um método para 
simular variáveis aleatórias a partir das 
distribuições F, e F,. Explique como po- 
demos simular a partir da distribuição 


FO) =pAG + A - ph) 0O<p<l 


Forneça um método para simular a partir 
de 


Id-cM + 0<x<1 


F(x) = 
3 “e 4 É 


x>1 


10.10 No Exemplo 2c, simulamos o valor ab- 
soluto de uma variável aleatória normal 
unitária usando o método da rejeição 
baseado em variáveis aleatórias exponen- 
ciais com taxa 1. Isso suscita a pergunta: 
seria possível ou não obter um algoritmo 
mais eficiente usando uma densidade ex- 
ponencial diferente — isto é, poderíamos 
usar a densidade g(x) = Ae **? Mostre 
que o número médio de iterações neces- 
sárias no esquema de rejeição é minimi- 
zado quando À = 1. 

10.11 Use o método da rejeição com g(x) = 1, 
O<x< 1, para formular um algoritmo 
que simule uma variável aleatória com 
função densidade 


“Joia -x? 0<x<1 
Pod 0 caso contrário 


10.12 Explique como você poderia usar núme- 
ros aleatórios para aproximar Eis k(x) dx, 
onde k(x) é uma função arbitrária. 

Dica: Se U é uniforme no intervalo (0, 1), 
o que é E[k(U)]? 
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10.13 Seja o par (X, Y) uniformemente distri- 
buído no círculo de raio 1 centrado na 
origem. Sua densidade conjunta é por- 
tanto 


1 
fop=— 0s2 +y=1 


Suponha que R=(X + Y)2 e 6 = 
tg '(Y/X) representem as coordenadas 
polares de (X, Y). Mostre que R e 6 são 
independentes, com Rº uniforme em (0, 
1) e 9 uniforme em (0,27%). 

10.14 No Exemplo 4a, mostramos que 


EIA —- VB =Ed - Uy=o 


quando V é uniforme em (1,1) e U é 
uniforme em (0,1). Mostre agora que 


Var — V9!2] = Var[ã — U?)12] 


e determine seu valor comum. 
10.15(a) Verifique que o mínimo de (4.1) ocor- 
re quando a é dado por (4.2). 
(b) Verifique que o mínimo de (4.1) é 
dado por (4.3). 

10.16 Seja X uma variável aleatória em (0,1) cuja 
densidade é f(x). Mostre que podemos esti- 
mar o g(x) dx simulando X e então toman- 
do g(X)/f(X) como nossa estimativa. Esse 
método, chamado de amostragem por im- 
portância, tenta escolher uma função f que 
tenha forma similar àquela de g de forma 
que g(X)/f(X) tenha variância pequena. 


PROBLEMAS DE AUTOTESTE E EXERCÍCIOS 


10.1 A variável aleatória X tem função densi- 
dade de probabilidade 


fQ)=Ce 0<x<1 


(a) Determine o valor da constante C. 
(b) Forneça um método para simular tal 
variável aleatória. 
10.2 Forneça uma abordagem para simular 
uma variável aleatória com função densi- 
dade de probabilidade 


f)=30m" 2 +21!) 0<x<1 


10.3 Forneça um algoritmo eficiente para si- 
mular o valor de uma variável aleatória 
com função de probabilidade 


p,=0,15 p,=02 p;=0,35 p,=0,30 


REFERÊNCIA 


10.4 Se X é uma variável aleatória normal 
com média q e variância o”, defina uma 
variável aleatória Y que possua a mesma 
distribuição que X e que lhe seja negati- 
vamente correlacionada. 

10.5 Sejam X e Y variáveis aleatórias expo- 
nenciais independentes com média 1. 

(a) Explique como poderíamos usar uma 
simulação para estimar Efe"). 

(b) Mostre como poderíamos aprimorar 
a abordagem da letra (a) usando uma 
variável de controle. 


[1] ROSS,S.M., Simulation. 4" ed. San Diego: Academic Press, Inc., 2006. 


Respostas para Problemas 
Selecionados 


CAPÍTULO 1 


1. 67.600.000; 19.656.000 2. 1296 4.24;4 5.144;18 6.2401 7.720; 72; 
144;72 8.120; 1260; 34.650 9.27720 10. 40.320; 10.080; 1152; 2880; 384 
11. 720; 72; 144 12. 24.300.000; 17100.720 13. 190 14. 2.598.960 
16. 42; 94 17. 604.800 18. 600 19. 896; 1000; 910 20. 36; 26 21. 35 
22.18 23.48 25. 52!/(131)" 2727720 28. 65.536;2520 29. 12.600; 945 
30. 564.480 31.165;35 32. 1287,14.112 33.220;572 


CAPÍTULO 2 


9. 74 10. 0,4; 0,1 11. 70; 2 12. 0,5; 0,32; 149/198 13. 20.000; 
12.000; 11.000; 68.000; 10.000 14. 1,057 15. 0,0020; 0,4226; 0,0475; 
0,0211; 0,00024 17. 9,10947 x 10% 18. 0,048 19. 5/18 20. 0,9052 
22. (n+ 1)? 23.512 25.04 26. 0,492929 27. 0,0888; 0,2477; 0,1243; 
0,2099 30. 1/18; 1/6; 1/2 31. 2/9;1/9 33. 70/323 36. 0,0045; 0,0588 
37. 0,0833; 0,5 38.4 39.0,48 40. 1/64; 21/64; 36/64; 6/64 41. 0,5177 
44. 0,3;0,2:0,1 46.5 48. 1,0604 x 10º 49.0,4329 50. 2,6084 x 10% 
52. 0,09145;0,4268 53.12/35 54.0,0511 55.0,2198;0,0343 


CAPÍTULO 3 


1.1/3 

2. 1/6; 1/5; 1/4; 1/3; 1/2; 1 3. 0,339 5.69 6.12 723 8 1/2 
9.7/11 10.0,22 14. 1/17;1/33 12. 0,504; 0,3629 14. 35/768; 210/768 
15. 0,4848 16. 0,9835 17. 0,0792; 0,264 18. 0,331; 0,383; 0,286; 48,62 
19. 44,29; 41,18 20. 0,4; 1/26 21. 0,496; 3/14; 9/62 22. 5/9; 1/6; 5/54 
23. 4/9; 1/2 24. 1/3; 1/2 26. 20/21; 40/41 28. 3/128; 29/1536 
29. 0,0893 30. 7/12; 3/5 33. 0,76, 49/76 34. 27/31 35. 0,62, 10/19 
36. 1/2 37. 1/3;1/5;1 38. 12/37 39. 46/185 40. 3/13; 5/13; 5/52; 15/52 
41. 43/459 42.34,48 43.4/9 45.1/11 48.2/3 50. 175; 38/165; 17/33 
51. 0,65; 56/65; 8/65; 1/65; 14/35; 12/35;,9/35 52. 0,11; 16/89; 12/27; 3/5; 9/25 
55.9 57 (c) 2/3 60. 2/3; 1/3; 3/4 61. 1/6; 3/20 65. 9/13; 12 69. 
9; 9; 18; 110; 4; 4; 8; 120 até 128 70. 1/9; 1/18 71. 38/64; 13/64; 13/64 
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73. 1/16; 1/32; 5/16; 1/4;31/32 TA. 9/19 75.3/4,7/12 78. pI — 2p +29) 
79. 0,5550 81. 0,9530 73. 0,5;0,6;0,8 74. 9/19; 6/19; 4/19; 7/15; 53/165; 
7/33 89. 97/142; 15/26; 33/102 


CAPÍTULO 4 

1. p(4) = 6/91; p(2) = 8/91; p(1) = 32/91; p(0) = 1/91; p(—1) = 16/91; p(—2) 
= 28/91 4.1/2;5/18;5/36; 5/84; 5/252;1/252;0:0;0;0 5.n-2i;i=0,..,n 
6. p(3) = p(—-3) = 1/8; p(1) = p(-1) = 3/8 12. p(4) = 1/16; p(3) = 1/8; 
p(2) = 1/16; p(0) = 1/2; p(-i) = p(i);p(0) = 1. 13.p(0) = 0,28; p(500) = 
0,27; p(1000) = 0,315: p(1500) = 0,09: p(2000) = 0,045 14. p(0) = 1/2; p(1) 
= 1/6; p(2) = 1/12; p(3) = 1/20: p(4) = 1/5 17. 1/4; 1/6; 1/12; 1/2 19. 1/2; 
1/10; 1/5; 1/10;1/10 20. 0,5918; não; —0,108 21.39,28;37 24.p = 11/18; 
máximo = 23/72 25. 0,46,1,3 26. 11/2;17/5 27. A(p + 1/10) 28.3/5 
31. p* 32.11 — 10(0,9)º 33.3 35. —0,067; 1,089 37. 82,2; 84,5 
39.3/8 40.11/243 42.p=1/2 45.3 50.1/10;110 51.e%;1 — 1,2eº 
53.1 —- e — e 56.253 57 0,5768; 0,6070 59. 0,3935; 0,3033; 
0,0902 60. 0,8886 61. 0,4082 63. 0,0821; 0,2424 65. 0,3935; 0,2293; 
0,3935 66. 2/(2n + 1); 2U(2n — 2);e! 67 2n; Qn — Dn — 1); e? 
68. (1 - e) 70.p + (1 — pje” T1. 0,1500; 0,1012 73. 5,8125 
74. 32/243; 4864/6561; 160/729; 160/729 78. 18(17)" (35) 81. 3/10; 5/6; 
75/1138 82.0,3439 83.1,5 


CAPÍTULO 5 | 

2.3,5e%” 3. não;não 4.12 5.1 -(0,01)º 6.4,0,% 7. 3/5; 6/5 
8.2 10.2/3;2/3 11.2/5 13. 2/3; 1/3 15. 0,7977; 0,6827; 0,3695; 
0,9522: 0,1587 16. (0,9938)” 18.22,66 19. (c) 1/2, (d) 1/4 20. 0,9994; 
0,75; 0,977 22. 9,5; 0,0019 23. 0,9258; 0,1762 26. 0,0606; 0,0525 
28.0,8363 29.0,9993 32.e!;e” 34.€e':1/3 38.3/5 40.1/y 


CAPÍTULO 6 

2. (a) 14/39; 10/39; 10/39; 5/39 (b) 84: 70; 70; 70; 40; 40; 40; 15 tudo dividi- 
do por 429 3. 15/26; 5/26; 5/26; 1/26 4. 25/169; 40/169; 40/169; 64/169 
TplinD)=p(L-p) 8.c=1/8;E[X]=0 9. (12xX+ 6x)/7; 15/56; 0,8625; 
5/7; 8/7 10.1/2;21 —- e! 11. 0,1458 12.393eº 13. 1/6;1/2 15. 7/4 
16.n(1/2) 17.1/3 18.7/9 19.12 21.2/5;2/5 22.não;1/3 23.1/2; 
2/3; 1/20; 1/18 25.eli! 28.1e41-3eº 29.0,0326 30. 0,3772; 0,2061 
31. 0,0829; 0,3766 32.€e%1 — 37 35. 5/13;8/13 36. 1/6; 5/6; 1/4; 3/4 
41. (y + xe td xe es 42. 1/2 + 3y/(4x) — y(4xX) 46. (1 — 2d/LY 
47.0,/9297 481-eM(L-e”) S2rim 53r 56.(a)ul(v+ 1? 
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CAPÍTULO 7 


1. 52,5/12 2. 324; 199,6 3.1/2;1/4;0 4.1/6;1/4;12 5.32 6.35 
7.0,9:49:42 8&.(1-(1-p))p 10.060 11.2n — Dp(1- pp) 
12. (Qu n(4n — 2), 3ni(4n — 2) 14. mí(l — p) 15.12 18.4 
21. 0,9301; 875755 22. 14,7 23. 147/110 26. n(n + Dill(n + 1) 
29. $7: 12; 4:18 31. 175/6 33.14 34. 20/19: 360/361 35. 21,2; 18,929; 
49,214 36. -n/36 37.0 38.1/8 41.6;112/33 42. 100/19; 16.200/6137; 
10/19; 3240/6137 45. 1/2;0 47.1Mn — 1) 48.6;7;5,8192 49. 6,06 
50.2y 51.y/4 53.12 54.8 56. N(1 e) 57125 63. —96/145 
65. 5,16 66.218 67. x[1 + (2p — 1] 69. 1/2; 1/16;2/81 70. 1/2, 1/3 
72. Vili(i+ DJ';o 73 u;l+o;sim;o” 79.0,176;0,141 


CAPÍTULO 8 

1. >19/20 2. 15/17; 3/4; =10 3. >3 4. <4/3; 0,8428 5. 0,1416 
6.0,9431 7.0,3085 8.0,6932 9.(327) 10.117 11.=,057 13.0,0162; 
0,0003; 0,2514; 0,2514 14. n = 23 16. 0,013; 0,018; 0,691 18. =0,2 
23. 0,769: 0,357; 0,4267; 0,1093; 0,112184 


CAPÍTULO 9 
1.1/9;5/9 3. 0,9735; 0,9098: 0,7358; 0,5578 10. (b) 1/6 14. 2,585: 0,5417; 
3,1267 15.5,5098 


Soluções para os Problemas 
de Autoteste e Exercícios 


CAPÍTULO 1 


1.1 (a) Há 4! sequências diferentes das letras C, D, E, F Para cada uma dessas sequên- 
cias, podemos obter uma sequência com A e B uma ao lado da outra inserindo 
AeBnaordensA,B ou B, A em qualquer uma das cinco posições, isto é, antes 
da primeira letra da permutação C, D, E, F, ou entre a primeira e a segunda 
letra, e assim por diante. Com isso, há 2 : 5 - 4! = 240 arranjos diferentes. Outra 
maneira de resolver este problema é imaginar que B está colado nas costas 
de A. Existem então 5! sequências em que A está imediatamente antes de B. 
Como também há 5! sequências nas quais B está imediatamente antes de A, 
obtemos novamente um total de 2 - 5! = 240 arranjos diferentes. 

(b) Há 6! = 720 arranjos possíveis, e, como existem tantos arranjos com A na fren- 
te de B como o contrário, existem 360 arranjos. 

(c) Dos 720 arranjos possíveis, há tantos arranjos com A antes de B antes de C 
quanto qualquer uma das 3! possíveis sequências de A, B, e C. Com isso, há 
720/6 = 120 sequências possíveis. 

(d) Dos 360 arranjos com A antes de B, metade terá C antes de D, e metade terá D 
antes de C. Portanto, há 180 arranjos com A antes de Be C antes de D. 

(e) Colando B nas costas de A, e D nas costas de C, obtemos 4! = 24 sequências 
diferentes em que B está logo após A, e D logo após C. Como a ordem de A e 
Be de Ce D pode ser invertida, há 4 - 24 = 96 arranjos diferentes. 

(£) Há 5! sequências em que E é a última letra. Portanto, há 6! — 5! = 600 sequên- 
cias nas quais E não é a última letra. 


1.2 3!4!3!3!,já que existem 3! possíveis ordens de países e depois ainda é necessário 
ordenar os compatriotas. 


1.3 (a) 10-9-8 = 720 

(b)8:7:6+2-3-8-7 = 672.0 resultado da letra (b) é obtido porque há 8 - 7 
- 6 escolhas que não incluem A ou B,e 3 - 8 - 7 escolhas nas quais um de À ou 
B sirva, mas não o outro. Isto resulta porque o membro de um par pode ser 
designado para qualquer um dos 3 escritórios, sendo a próxima posição preen- 
chida por qualquer uma das 8 pessoas restantes e a posição final preenchida 
por qualquer uma 7 pessoas restantes. 

(0)8:7:6+3-2-8=384. 

(d)3-9-8 = 216. 

(6)9-8:7+9-8=576. 


14 (a) (5) 
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co(5) (6) + (5) (3) + (5) (5) 
15 o 5] = 210 


1.6 Há (3) = 35 escolhas para as três posições das letras. Para cada uma delas, há 


(26)(10)* placas diferentes. Portanto, existem no total 35 - (26) - (10)' placas dife- 
rentes. 


1.7 Qualquer escolha de r dos n itens é equivalente a uma escolha de n — r, isto é, de 
itens não selecionados. 

1.8 (a) 10-9:-9---.9=10-9"! 
(b) (5) 9"-i, já que há h escolhas para as i posições nas quais os zeros serão 


colocados e cada uma das demais n — i posições pode conter quaisquer algaris- 
mos 1,...,9. 


19 (a) E) 
o) 
(DO 


(d) nº 
(e) (6) =3 (5) +3n(n-D +n 


110 Há9-8-7:6-5 números nos quais não se repete nenhum algarismo. Como há 
5 


o] - 8-7 - 6 números nos quais apenas um algarismo específico aparece duas ve- 


ERES , , Er : 
zes, então há ae -8-7 - 6 números nos quais apenas um único algarismo aparece 
duas vezes. Como há 7 - = números nos quais dois algarismos específicos apare- 
E fo, a: da ; 
cem duas vezes, então há (> 7: E números nos quais dois algarismos aparecem 


duas vezes. Logo, a resposta é 


5 9 
0:8:7:6:5+9(5)-8:7-6+(5)7-28h 


1.11 (a) Podemos encarar este problema como um experimento em sete etapas. Pri- 
meiro escolha 6 casais que possuam um representante no grupo, e depois se- 
lecione um dos membros de cada um desses casais. Pelo princípio básico da 
contagem generalizado, há e pod escolhas diferentes. 

(b) Primeiro selecione os 6 casais que possuem um representante no grupo e en- 
tão selecione 3 desses casais que vão contribuir com um homem. Portanto, há 
o ) ) = von escolhas diferentes. Outra maneira de resolver este problema é 
selecionar primeiro 3 homens e depois 3 mulheres que não estejam relaciona- 


das a eles. Isso mostra que há E) = sui escolhas diferentes. 
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3/43 4/12 
que possuem 3 mulheres e 3 homens; o segundo fornece o número de comitês que 
possuem 4 mulheres e 2 homens. 


1.12 (3) (3) + (4) (3) = 3430. O primeiro termo fornece o número de comitês 


1.13 (número de soluções de x, +... + x, = 4)(número de soluções de x, +... + x, =5) 


(número de soluções de x, +... + x,= 6) = 8) (9 (10) 
a 5 abadia : 


— dl: 
1.14 Como há É = 0) vetores positivos cuja soma é j, deve haver 3) É = o ve- 
am j=n 
tores como esse. Mas É 3 ] é o número de subconjuntos de tamanho n do 


conjunto de números (1,..., k) no qual j é o maior elemento no subconjunto. Con- 


k = 

sequentemente, >) Ç -4 é justamente o número total de subconjuntos de ta- 
j=n 

manho n de um conjunto de tamanho k, o que mostra que a resposta anterior é 


igual a E 
8 n 
1.15 Vamos primeiro determinar o número de resultados diferentes nos quais k pes- 
soas são aprovadas. Como há :) diferentes grupos de tamanho k, e k! possíveis 
: «(tn arg E 
sequências de notas, tem-se que há ( oe resultados possíveis nos quais k pessoas 


são aprovadas. Consequentemente, há > (o) resultados possíveis. 
k=0 
1.16 O número de subconjuntos de tamanho 4 é (1) = 4845. Como o número de sub- 
conjuntos que não contém nenhum dos primeiros cinco elementos é pa ) = 1365, 
o número daqueles que contêm pelo menos um é 3480. Outra maneira de resolver 
este problema é observar que há (6) ( =) subconjuntos que contêm exatamente i 
dos primeiros cinco elementos e calcular a soma para i = 1,2,3,4. 


1.17 Multiplicando ambos os lados por 2, devemos mostrar que 
n(n-D=k(k-D+2kn-k)+(n-k(n-k-1) 
Obtém-se a expressão acima porque o lado direito é igual a 
Ra-Z+D+k(1+2n-n-n+D+n(n-1) 


Para um argumento combinatório, considere um grupo de n itens e um subgrupo 
contendo k dos n itens. Então (8) é o número de subconjuntos de tamanho 2 que 
contêm 2 itens do subgrupo de tamanho k, k(n — k) é o número de subconjuntos 
que contêm 1 item do subgrupo, e e) é o número de subconjuntos que contêm 
Q itens do subgrupo. A soma desses termos fornece o número total de subgrupos 
de tamanho 2, isto é, (5). 


1.18 Há 3 escolhas que podem ser feitas de famílias formadas por um único pai e 1 
filho;3 - 1-2 = 6escolhas que podem ser feitas de famílias formadas por um único 
paie 2 filhos;5 - 2-1 = 10 escolhas que podem ser feitas de famílias formadas por 
2 pais e um único filho; 7 - 2 - 2 = 28 escolhas que podem ser feitas de famílias for- 
madas por 2 pais e 2 filhos; 6 - 2 - 3 = 36 escolhas que podem ser feitas de famílias 
formadas por 2 pais e 3 filhos. Há, portanto, 80 escolhas possíveis. 
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1.19 Escolha primeiro as 3 posições dos números e depois distribua as letras e os nú- 
meros. Assim, há (5) -26:25:24:23:22:10-9- 8 placas diferentes. Se os núme- 
ros devem ser consecutivos, então há 6 posições possíveis para os números. Nesse 
caso, há 6 - 26:25 -24-23-22:10-9-8 placas diferentes. 


CAPÍTULO 2 
21(a)2:3-4=24 
(b)2:6=6 
()3-4=12 
(d) AB = [(galinha, massa, sorvete), (galinha, arroz, sorvete), (galinha, batatas, 
sorvete)) 
(e) 8 


(£f) ABC = ((galinha, arroz, sorvete)) 


2.2 Seja À o evento em que um terno é comprado, B o evento em que uma camisa é 
comprada, e Co evento em que uma gravata é comprada. Então 


P(AUBUC)=0,22+ 0,30 + 0,28-0,11-0,14-0,10 + 0,06 = 0,51 


(a) 1-0,51 = 0,49 
(b) A probabilidade de que dois ou mais itens sejam comprados é 


P(ABU ACU BC) = 0,11 + 0,14 + 0,10 - 0,06 — 0,06 — 0,06 + 0,06 = 0,23 


Com isso, a probabilidade de que exatamente 1 item seja comprado é 0,51 — 0,23 
= 0,28. 


2.3 Por simetria, a décima quarta carta tem a mesma probabilidade de ser qualquer 
uma das 52 cartas; logo, a probabilidade é igual a 4/52. Um argumento mais formal 
é contar o número dos 52! resultados para os quais a décima quarta carta é um ás. 
Isso resulta em 
4.51.50...2.1 4 


p= 62)! 52 


Fazendo com que A seja o evento em que o primeiro ás ocorre na décima quarta 
carta, temos 


48. 47...36 - 4 
P A ———————— — 
e 52 -51...40. 39 usta 
2.4 Seja D o evento em que a temperatura mínima é de 21ºC. Então 
PAU B)=P(A) + P(B) — P(AB) = 0,7 — P(AB) 
PCUD =P(C) + P(D) — P(CD) = 02 4 P(D) — P(DC) 


Como 4UB=CUDeAB=cCD,subtraindo uma equação da outra obtemos 


0=0,5-P(D) 
ou P(D) = 0,5. 
52.48.44.40 
2.5 a)-—— > — 
( 152 - 81.50.49 nero 
52:39.26-13 
(b) a = 0,1055 


52-51.50.49 
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2.6 Seja Ro evento em que ambas as bolas são vermelhas, e B o evento em que ambas 
são pretas. Então 
3.4 3.6 


PRUB)=PR)+P(B)=5—5 + arms OS 


n 
2.9 Seja S = [UJ As, e considere o experimento de escolher aleatoriamente um ele- 
i=1 
mento de S. Então P(A) = N(A)/N(S), e o resultado é obtido a partir das Proposi- 
ções 4.3 e 4.4. 


2.10 Como há 5! = 120 resultados nos quais a posição do cavalo número 1 é especifica- 
da, tem-se N(A) = 360. Similarmente, N(B) = 120,e N(AB) = 2-4! = 48. Portan- 
to, do Problema de Autoteste 2.9, obtemos N(A U B) = 432. 

2.11 Uma maneira de resolver este problema é começar com a probabilidade comple- 


mentar de que pelo menos um naipe não apareça. Seja 4, i = 1,2,3,4,0 evento 
em que nenhuma carta do i-ésimo naipe aparece. Então 


4 
P(A |=D PA) - SIS PIAAD + = — P(A, ADASAS) 
i=1 i 


j ii<j 
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(5) 


«1 (Da) 


s2 2 
5 
39 26 13 
5 5 5 
4 6 
52 52 52 
5 5 5 
A probabilidade desejada é igual a 1 menos a expressão anterior. Outra maneira 


de resolver o problema é fazer com que A seja o evento em que todos os 4 naipes 
são representados, e então usar 


+4 


P(A) = P(n,n,n,n,0) + P(n,n,n,0,n) + P(n,n,o,n,n) + P(n,o,n,n,n) 


onde P(n,n,n,0,n) é, por exemplo, a probabilidade de que a primeira, a segunda 
e a terceira cartas sejam de um novo naipe, a quarta carta seja de um naipe velho 
(isto é, de um naipe que já tenha aparecido), e a quinta carta seja de um novo 
naipe. Isso resulta em 
52-39.26-13.484+52.39.26.36-13 
52-51.50.49.48 
E ao A A E SD, 
52-51.50.49.48 
52-39 - 26 - 13(48 + 36 + 24 + 12) 
e 52-51.50.49.48 


P(A) = 


= 0,2637 


2.12 Há (10)!/2º diferentes divisões de 10 jogadores em um par, um segundo par, e as- 


“ sim por diante. Há, portanto, (10)!(5!2”) divisões em 5 pares. Existem ( É ) ( E ) 


maneiras de se escolher o atacante e o defensor que ficarão juntos, e 2 maneiras 
de ordenar os respectivos pares. Como existe 1 maneira de formar um par com os 
dois defensores restantes e 4!(2127) = 3 maneiras de se formar dois pares com os 
atacantes restantes, a probabilidade desejada é 


6/4 
(O (Bom 
AMADA O — = 05714 


P(2 pares mistos) = 
ai = ADE) 
2.13 Suponha que R represente o evento em que a letra R é repetida; similarmente, 
defina os eventos E e V. Então 


Eno o a 
Plmesma letra) = P(R) + P(E) + P(V) E + is + -= 
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c 


il 
2.14 Sejam B, = 4,,B,= A (J 4; | ,i> 1. Então, 
j=1 


oo oo 
P U4; =P Us; 
i=1 i=1 
oo 
=53  P(B) 


i=1 
Do 

<S PA) 
i=1 


Onde a última igualdade usa o fato de que os B;s são mutuamente exclusivos. 4 
desigualdade é então obtida porque B,C A.. 


2.15 


c 


Do 
Sidi SPAS 
i=1 
=1 


2.16 O número de partições nas quais (1) é um subconjunto é igual ao número de 
partições dos n — 1 elementos restantes em k — 1 subconjuntos não vazios, isto 
é, Tea(n — 1). Como existem T,(n — 1) partições de (2...., n — 1) elementos em k 
subconjuntos não vazios, e k possibilidades de alocação para o elemento 1, tem-se 
que existem kT,(n — 1) partições para as quais [1) não é um subconjunto. Com 
isso, obtém-se o resultado desejado. 


2.17 Suponha que R, W e B representem os eventos em que, respectivamente, nenhuma 
bola vermelha, branca ou azul é escolhida. Então 
PRUWU B)=P(R)+ P(W)+ P(B) — P(RW) — P(RB) 
— P(WB) + P(RWB) 
7 
5 


RO, 
E to do de) 6) 


+ - — 
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Logo, a probabilidade de que todas as cores apareçam no subconjunto escolhido é 
de aproximadamente 1 — 0,2933 = 0,7067. 


81654 2 
2.18 (2) Gis TAIS = DI 
4 ã : RE + 98165 9 
(b) Como há 9 bolas não azuis, a probabilidade é as 413 = 35 


(c) Como há 3! sequências possíveis de cores diferentes, e todas as possibili- 
dades para as 3 últimas bolas são igualmente prováveis, a probabilidade é 
31485 4 
171615 > 17 

(d) A probabilidade de que as bolas vermelhas estejam em 4 posições específicas é 
igual a Ta Como há 14 possíveis alocações de bolas vermelhas nas quais 


4 14.43.21 1 
elas estão juntas, a probabilidade é sis = 170 
2.19 (a) A probabilidade de que as 10 cartas sejam formadas por 4 espadas, 3 copas, 
CCC) 
2 ouros e 1 paus é SAS, Como há 4! escolhas possíveis dos naipes 
10 


para que eles tenham 4,3,2,e 1 cartas, respectivamente, resulta que a probabi- 
24 131)/131)/131)/13 
idade é igual a MCICICO 
10 

(b) Como há (3) = 6 escolhas para os dois naipes que vão contribuir com 3 cartas, 
e 2 escolhas para o naipe que vai contribuir com 4 cartas, a probabilidade é 

(00) 

s2 É 

(6) 

2.20 Todas as bolas vermelhas são retiradas antes de todas as bolas azuis se e somente 


se a última bola retirada for azul. Como todas as 30 bolas tem a mesma probabili- 
dade de serem a última bola retirada, a probabilidade é igual a 10/30. 


CAPÍTULO 3 


3.1 (a) p(não há ases) = É 13 3) j ( 5 
(1) 


(5) 
aa 
(3) 


3.2 Suponha que L, represente o evento em que o tempo de vida útil seja maior que 
10.000 x i km. 
(a) P(LL,) = P(LLYP(L,) = P(LP(L,) = 1/2 
(b) P(LIL) = P(LL)P(L) = P(L)P(L,) = 1/8 


(b) 1 - P(não há ases) — 


3.3 Coloque 1 bola branca e O bolas pretas em uma urna, e as 9 bolas brancas e as 10 
bolas pretas restantes na segunda urna. 
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3.4 Seja To evento em que a bola transferida é branca, e W o evento em que uma bola 
branca é retirada da urna B. Então 


PWIDP(T) 

PWIDP(T) + PWITIP(TO) 

' CINE Ee 
Q/D02/3) + 1/DA/3) 


P(TIW) = 


3.5 (a) porque cada uma das r + w bolas tem a mesma probabilidade de ser a 


bola retirada. 
(b). (c) 
P(RiR;) 
P(Ri;) 
(69) 
0) 
Rs 
rt+w 
E is ]. 
“Cr4+w-l 


P(R;IRD) = 


Um argumento mais simples é notar que, para i * j, dado que a i-ésima bola 
retirada é vermelha, a j-ésima bola retirada tem a mesma probabilidade de ser 
qualquer uma das r + w — 1 bolas restantes, das quais 7 — 1 são vermelhas. 


3.6 Suponha que B, represente o evento em que a bola i é preta, e considere R; = Bj. 
Então 
P(Ro|B)P(B1) 
P(Ro IB) P(B1) + PCRoIR)P(RI) 
E [lb + r + o]b/b + 1] 
“yb+r+o]b/d + n]+lr+ ob +r+dr/b + n] 
b 
 b+rr+c 


P(BilRo) = 


3.7 Suponha que B represente o evento em que ambas as cartas são ases. 
(a) 
P(B, sim para o ás de espadas) 
P(sim para o ás de espadas) 


1 3 1 51 
1 1 1 1 
52 / 52 
2 2 
=3/51 
(b) Como a segunda carta tem a mesma probabilidade de ser qualquer uma das 


51 cartas restantes, das quais 3 são ases, vemos que a resposta nesta situação 
também é 3/51. 


P(Blsim para o ás de espadas) = 
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(c) Como sempre podemos trocar qual carta é considerada a primeira e qual é 
considerada a segunda, o resultado deve ser o mesmo da letra (b). Um argu- 
mento mais formal é dado a seguir: 


P(B,a segunda carta é um ás) 
P(a segunda carta é um ás) 


P(Bla segunda carta é um ás) = 


= P(B) 
“P(B)+ Pla primeira não é um ás, a segunda é um ás) 
= (4/52)(3/51) 
— (4/5D(/51) + (48/52)(4/51) 
=3/51 
(d) 
N P(B) 
PíBlpelo menos uma) = Pipolomend um) Ends 
o (4/52)(3/51) 
“1 (48/52)(47/51) 


= 1/33 


3.8 
P(HIE)  P(HE) PODP(EIH) 
P(GIE) P(GE) P(G)P(EIG) 


A hipótese H é 1,5 vezes mais provável. 


3.9 Suponha que A represente o evento em que a planta esteja viva e W represente o 
evento em que ela tenha sido regada. 


(a) 
PA) = P(AAIWPW) + PAIWIPWS) 
= (0,85)(0,9) + (0,2) (0,1) = 0,785 
(b) 
c14º) = PIAIWIPOWS) 
P(WSIAS) = EO 
* (08501) 16 
“0215 43 


22 
3.10 (a) 1 - P(não há bolas vermelhas) = 1 — E 
6 
(b) Dado que nenhuma bola vermelha tenha sido sorteada, as seis bolas sorteadas 
podem ser, com mesma probabilidade, qualquer uma das 22 bolas não verme- 


lhas. Logo, 
10 12 
CC) 
P(2 verdesjnenhuma vermelha) = NOR 
é) 


3.11 Seja Wo evento em que a pilha funciona, e suponha que Ce D representem os 
eventos em que a pilha é dos tipos C e D, respectivamente. 
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(a) P(W) = P(WIOP(O) + P(WID)P(D) = 0,7(8/14) + 0,4(6/14) = 4/7 
(b) 
PCW)  PWIOPC) 038/19) 


do DR 


3.12 Seja L, o evento em que Maria gosta do livro i, i = 1,2. Então 
P(LÍLo) P(LILo) 


A OE DA 


Usando o fato de L, ser a união dos eventos mutuamente exclusivos L,L, e L$La, 
vemos que 


0,5 = P(L;) + P(L;L,) + P(L$Lo) = 0,4 + P(LSLo) 
Logo, 


P(Loll$) = 04 =025 


3.13 (a) Esta é a probabilidade de que a bola retirada seja azul. Como cada uma das 30 
bolas tem a mesma probabilidade de ser a última bola retirada, a probabilida- 
de é de 1/3. 
(b) Esta é a probabilidade de que a última bola vermelha ou azul a ser retirada 
seja uma bola azul. Como é igualmente provável que ela seja qualquer uma 
das 30 bolas vermelhas ou azuis, a probabilidade de que ela seja azul é de 1/3. 
(c) Suponha que B,, R, e G, representem, respectivamente, os eventos em que a 
primeira bola retirada é azul, a segunda é vermelha, e a terceira é verde. Então 


820 8 
3830 57 
onde P(G,) é justamente a probabilidade de que a última bola seja verde. 
P(R;|Gs) é calculada observando-se que, dado que a última bola é verde, cada 
uma das vinte bolas vermelhas e 10 bolas azuis tem a mesma probabilidade 


de ser a última do grupo a ser retirada. Assim, a probabilidade de que ela seja 


uma das bolas vermelhas é igual a 20/30 (naturalmente, P(B,|R,G;) = 1). 


8 
(d) P(B) = P(B,G;R;) + P(BR,G)) = 38 18 + = TA 


P(B/R2G3) = P(G3) P(R2163)P(Bi|R2G3) = 


3.14 Seja H o evento em que a moeda dá cara, T, o evento em que B recebe a informa- 
ção de que a moeda deu cara, F o evento em que A se esquece do resultado,e € o 
evento em que B recebe a informação correta. Então 


(a) 
PT) = PTI PA) + PCTRIPOPÇFS 
= 0,68 
(b) 
P(C) = PCCID PCP) + PCCIFSPÇFS 
= (0,5)(0,4) + 1(0,6) = 0,80 
(c) 


PAT) 
PCT) 


P(H|Ty) = 
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Agora, 
P(HTy) = PHTIPDPO) + PHToFOPÇS) 
= PHIDPTIHNDP(E) + PHP) 
= (0,8)(0,5)(0,4) + (0,8)(0,6) = 0,64 


o que dá o resultado P(HI|T,) = 0,64/0,68 = 16/17 


3.15 Como o rato preto tem uma cria marrom, podemos concluir que seus dois pais 
possuem um gene preto e um marrom. 


(a) 

P(2) 1/4 1 
P(pelomenosum 3/4 - 3 
(b) Seja F o evento em que todas as crias são pretas, B, o evento em que o rato 


preto possui 2 genes pretos, e B, o evento em que ele possui 1 gene preto e 1 
gene marrom. Então 


P(2 pretoslpelo menos um) = 


PBP) = P(FIB))P(Bo) 
Ê P(FIB>)P(B>) + P(FIBDP(BI) 
(1/3) 16 


“DA + QD) 17 


3.16 Suponha que F seja o evento em que a corrente flui de A para B,e C,o evento em 
que o relé i é fechado. Então 


P(P) = P(FICDp1 + P(FICDA — pj) 


Agora, 
P(FIC) = P(C4 U C5C5) 
= P(C4) + P(C2C5) — P(C4C5C5) 
= pa + P2ps — P4p2Ps 
Também, 


P(FICS) = P(C,C5 U CoC3C4) 
=p2Ps + P2P3p4 — P2P3P4Ps 
Portanto, para a letra (a), obtemos 
P(F) = pi(ps + p2ps — pap2ps) + (1 — pilpaíps + papa — P3paps) 
Para a letra (b), faça q, = 1 — p;. Então 
P(Cs|F) = P(FIC3)P(Ca)/ PE) 
=pall — P(CIC; U CGC] PD) 
=pa(l — qigo — qugs + qrgrgags)/ PCP) 


3.17 Suponha que A seja o evento em que o componente 1 está funcionando, e F seja o 
evento em que o sistema funciona. 


(a) 
PAP) PIAS O AM az 
EAN = PP PP 1-(1/22 3 
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onde P(F) foi calculada notando-se que esta probabilidade é igual a 1 menos a 
probabilidade de que ambos os componentes apresentem falhas. 


(b) 
PAP PFAPA  GAL/D 3 
PD o PD A+ 4 


P(AIF) = 


onde P(F) foi calculada notando-se que esta probabilidade é igual à probabili- 
dade de que 3 componentes funcionem mais as três probabilidades relaciona- 
das a exatamente 2 dos componentes funcionando. 


3.18 Se supomos que os resultados das rodadas sucessivas são independentes, então a 
probabilidade condicional do próximo resultado não é alterada pelo resultado das 
10 rodadas anteriores. 
3.19 Condicione no resultado das jogadas iniciais 
P(A ímpar) = P(1 Po P) + 4 — P9)P,P3 + P,PoPs(A ímpar) 
+ (= PG — PJ — PJP(A ímpar) 


então, 
Pd —- PJ -P3) + O -PoPoP: 


POR a Pre Pipe Dbje DP) 


3.20 Suponha que A e B sejam os eventos em que a primeira e a segunda tentativa são 
as maiores, respectivamente. Também, suponha que E seja o evento em que os 
resultados das tentativas são iguais. Então 


1= P(A) + P(B) + P(E) 
Mas, por simetria, P(A) = P(B); logo, 


n 
1-3)? 
1-—- PE) = i=1 


2 2 


Outra maneira de se resolver o problema é notar que 


P(B) = 


P(B) = a a P(primeira tentativa resulta em i, segunda tentativa resulta em j) 


i j>i 


=> >,PiP; 


i j>i 
Para ver que as duas expressões deduzidas para P(B) são iguais, observe que 


n n 
Led pi Di 


i=1 j=l 


=> >, Dip; 
TJ 

=> D+) > pp; 
z 


i fã 


=) +42) pi; 
i 


i j>i 
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3.21 Suponha que E = (A obtém mais caras que B); então 


P(E) = P(EJA lidera após ambos jogarem n vezes)P(A lidera após ambos jogarem n vezes) 
+ P(Elempate após ambos jogarem n vezes)P(empate após ambos jogarem n vezes) 
+ P(EIB lidera após ambos jogarem n vezes)P(B lidera após ambos jogarem n vezes) 


1 
= P(A lidera) + >P(empate) 


Agora, por simetria, 
P(A lidera) = P(B lidera) 
1 — P(empate) 
ARE Es 


Portanto, 
PE=1 
“2a 


3.22 (a) Falso: Lançados 2 dados, suponha que E = (soma = 7),F = [não aparece um 4 
no 1º dado), e G = [não aparece um 3 no 2º dado). Então, 


P(7,não (4,3)) 5/36 


P(EJFU G) = “Pinão (4,3)) — 35/56 = 5/35 * P(E) 
(b) 
P(E(F U 6) = P(EF U EG) 
= P(EF) + P(EG) já que EFG = 4 
= P(EJP(P) + P(G)] 
=PEP(FUG) já que FG = 4 
(c) 
— P(EFG) 
P(GIEF) = PF) 
— PEBJP(FG) = pa 
PED já que E é independente de FG 
= PPP) pela independência 
PP) 
= P(G). 


3.23 (a) necessariamente falso; se eles fossem mutuamente exclusivos, então teríamos 
O = P(AB) < P(A)P(B) 
(b) necessariamente falso; se eles fosse independentes, então teríamos 
P(AB) = P(A)P(B) > 0 
(c) necessariamente falso; se eles fossem mutuamente exclusivos, então teríamos 
P(AUB)=P(A)+P(B)=12 


(d) possivelmente verdade 
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3.24 As probabilidades nas letras (a), (b) e (c) são 0,5, (0,8)” = 0,512, e (0,9) = 0,4783, 
respectivamente. 

3.25 Suponha que D, i = 1,2, represente o evento em que o rádio i apresenta defeito. 
Suponha também que A e B sejam os eventos em que os rádios tenham sido pro- 
duzidos pelas fábricas A e B, respectivamente. Então, 


P(D,D 
PDD) = o 


— PDiDIAJPA) + P(D, Do|B)P(B) 
—  P(DIIAP(A) + P(DiIB)P(B) 
— (0,052(1/2) + (0,01)2(1/2) 

— (0051/23 + (0,01(1/2) 

= 13/300 


3.26 Sabemos que P(AB) = P(B), e devemos mostrar que isso implica que P(B'AS = 
P(A9. Uma maneira é a seguinte: 
P(BA) =PGA U B)9) 


=1-PAUB) 
=1— P(A) — P(B) + P(AB) 
=1- P(A) 

= P(A) 


3.27 O resultado é verdadeiro para n = 0. Com A, representando o evento em que há i 
bolas vermelhas na urna após a n-ésima rodada, suponha que 
1 


——, i=1),.on+1 
n+1 


P(A;) = 
Agora, suponha que B,,j = 1,...,n + 2, represente o evento em que há j bolas ver- 
melhas na urna após a (n + 1)-ésima rodada. Então, 
n+1 
P(B) => PBjADP(A;) 
i=1 
n+1 


a EPA 


1 
= ma TU GBA) + P(B;JAD] 


Como há n + 2 bolas na urna após a n-ésima rodada, tem-se que P(BJA, ,) é a 
probabilidade de que uma bola vermelha seja escolhida quando j — 1 das n + 
2 bolas na urna são vermelhas, e P(B|A,) é a probabilidade de que uma bola 
vermelha não seja escolhida quando j das n + 2 bolas na urna são vermelhas. 
Consequentemente, 
n+2-—;j 

n+2 


j-l 
P(B;A, 1) = 3 P(BJA;) = 
(B;| | 1) n+2 (B;| ) 
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Substituindo esses resultados na equação para P(B,), obtemos 
1 | j-1 n+2— || 1 


P(B) = = 
(Bj) n+1|ln+42 n+2 


“n+2 
o que completa a demonstração por indução. 


3.28 Se 4, é o evento em que o jogador i recebe um ás, então 
Indo Sm=1 


2Qn-—-2 
Pupej = 
fa ds (17) CE oo cdr 
n 


Numerando os ases arbitrariamente e observando que o jogador que não recebe o 
primeiro ás receberá n das 2n - 1 cartas restantes, vemos que 


P(AjÃo) = 


2n-—-1 
Portanto, 
P(AÃo)) n-—1 
PA) 3n-1 


P(AZIA) =1 — P(AZlA) =1 — 


Podemos considerar o resultado da divisão de cartas como o resultado de duas 
tentativas, onde se diz que a tentativa i, i = 1,2, é um sucesso se o ás número i vai 
para o primeiro jogador. Como as posições dos dois ases se tornam independentes 
à medida que n tende a infinito, com cada um deles possuindo a mesma probabi- 
lidade de ser dado a qualquer jogador, tem-se que as tentativas se tornam inde- 
pendentes, cada uma com probabilidade de sucesso 1/2. Portanto, no caso limite 
onde nº, o problema se torna aquele de determinar a probabilidade condicional 
de que se obtenham duas caras, dado que pelo menos uma seja obtida, quando 
duas moedas são jogadas. Como !=1 converge para 1/3, a resposta concorda com 


3n-À 
aquela do Exemplo 2b. 


3.29 (a) Para qualquer permutação i,....,i, de 1,2,...,n,a probabilidade de que os tipos 
sucessivos coletados sejam do tipo i,,..., i, é iguala pi; --- Pin = [[;=1 Pi Conse- 
quentemente, a probabilidade desejada é igual a n! T [4 pi. 

(b) Para i,,..., i, todos distintos, 


— k é 
PE E)= (: - ) 


o que se obtém porque não há cupons de tipos i,,..., i, quando cada uma das 
n seleções independentes envolve um dos demais n — k tipos. Obtém-se agora 
pela identidade inclusão-exclusão que 


E RE SSB ET LA n- kN" 
Pla) = 1 1) (( E ) 


Como 1 — P(UZ , E;) é a probabilidade de que um de cada tipo seja obtido, 
pela letra (b) tem-se que ela é igual a E. Substituindo esse resultado na equa- 
ção anterior, obtemos 


cmo a(n =) 
1! 2 (5) ( n 
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ou 
nt=n" — Seviti(o) — 
k=1 


ou 


nie Devo - or 
k=0 


3.30 
PEEUD=PEIFEU F)PFEU FP + PEIF(EU P)PFIEU F) 
Usando 
HEUP=FeF(EUPM=FE 
obtemos 


P(EIE U P = PEIPP(IE U F) + PEIEF9PEJE U F) 
= PEIDPRE UP + PFIEU F) 
> P(EIBP(FIE U P) + MEIDPEIEU FP) 
= P(EIF) 


CAPÍTULO 4 


4.1 Como a soma das probabilidades é igual a 1, devemos ter 4P|X =3]) + 0,55 = 1,0 
que implica que P(X = 0) = 0,375, P(X = 3] = 0,125. Portanto, E[X] = 1(0,3) + 
2(0,2) + 3(0,125) = 1,075. 

4.2 A relação implica que p, = cpp i = 1,2,onde p, = P|X = i). Como a soma dessas 


probabilidades é igual a 1, tem-se que 


1 +J=1I> E EO = 
pol + c ) a ERR 


Portanto, 
c+2 


EX]=p + 2p;= RA O 


4.3 Seja X o número de jogadas. Então a função de probabilidade de X é 


p=pP+(-p), p=1-»=2p(1-p) 


Portanto, 


EX] =-2p,+3p;=2p,+3(1-p))=3 p'- (1 py 


4.4 A probabilidade de que uma família escolhida aleatoriamente tenha i filhos é n,/m. 
Logo, 


EX] = Sin/m 
i=1 
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Também, como há in, filhos em famílias com i filhos, tem-se que a probabilidade 
de que um filho aleatoriamente escolhido seja de uma família com i filhos é dada 
r 


por in;/ >: ini. Portanto, 
i=1 r 


Logo, devemos mostrar que 


r r 
Dm Din 
i=1 i=1 

r r 


ou, equivalentemente, que 
r r 
Dn Em = Din Dim 
j=1 0 i=l i=1 j=1 


ou, equivalentemente, que 
r r r Fr 
DD nim; = 3 5 ijnin; 
i=1 j=1 i=1 j=1 


Mas, para um par fixo i, j, O coeficiente de nn, no lado esquerdo da soma da desi- 
gualdade anterior é ? + j, enquanto o coeficiente no lado direito da soma é 2ij. 
Portanto, é suficiente mostrar que 


P+P=2ij 
o que procede porque (i-j)' = 0. 
4.5 Seja p = P(X = 1). Então E(X] = p e Var(X) = p(1 - p), assim 
p=3p(1-p) 
o que implica que p = 2/3. Portanto, P(X = 0) = 1/3. 


4.6 Se você aposta x podendo ganhar a quantia apostada com probabilidade p e per- 
der esta quantia com probabilidade 1 — p, então seu ganho esperado é 


xp-x(1-p) = (2p— 1)x 
que é positivo (e crescente em x) se e somente se p > 1/2. Assim, se p = 1/2, 
maximiza-se o retorno esperado apostando-se 0, e se p > 1/2, maximiza-se o re- 
torno esperado apostando-se o máximo valor possível. Portanto, se é sabido que a 
moeda de 0,6 foi escolhida, então você deve apostar 10. Por outro lado, se é sabido 
que a moeda de 0,3 foi escolhida, então você deve apostar O. Com isso, seu retorno 
esperado é 


1 
Ig2-1n0+10-c=1-C 
2 2 
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Como o seu retorno esperado é O caso você não tenha a informação (porque nesse 
caso a probabilidade de vitória é de 10,6) + 40,3) < b, tem-se que, se a informa- 
ção custar menos que 1, então ela vale a compra. 


4.7 (a) Se você virar o papel vermelho e ver o valor x, então o seu retorno esperado se 
você mudar para o papel azul é 


2x(1/2) + x/2(1/2) = Sx/4 > x 


Assim, é sempre melhor mudar de papel. 


(b) Suponha que o filantropo escreva o valor x no papel vermelho. Então o valor 
no papel azul é 2x ou x/2. Observe que, se x/2 = y, então o valor no papel azul 
será pelo menos igual a y, e com isso será aceito. Neste caso, portanto, a recom- 
pensa tem a mesma probabilidade de ser 2x ou x/2. Assim, 


E(R,()] = 5x/4,  sex2=2 
Se x/2 <y = 2x, então o papel azul será aceito se o seu valor for 2x e rejeitado 
se o seu valor for x/2. Portanto, 
E[R,09)] = 2x(1/2) + x(1/2) = 3x/2 sex2<y=<2x 
Finalmente, se 2x < y, então o papel azul será rejeitado. Neste caso, portanto, 
a recompensa é x. Assim, 
RO)=x seZx<y 
Isto é, mostramos que quando o valor x está escrito no papel vermelho, o re- 


torno esperado é 


ba sex < y/2 
ElRy()]= | 3x/2 sey/2=x<2y 
5x/4 sex =2y 


4.8 Suponha que n tentativas independentes, cada uma com probabilidade de suces- 
so p, sejam realizadas. Então, o número de sucessos será menor ou igual a i se e 
somente se o número de fracassos for maior ou igual a n — i. Mas como cada ten- 
tativa é um fracasso com probabilidade 1 — p, resulta que o número de fracassos é 
uma variável aleatória binomial com parâmetros n e 1 — p. Portanto, 

Pfcesto(n,p) = ij=Plcesto(n,l —- p)=zn-— i) 
=1 -—- Pfcesto(nl —- p)=n-—-i-1) 
A igualdade final resulta do fato de que a probabilidade do número de fracassos 
ser maior ou igual a n — i é igual a 1 menos a probabilidade de que ela seja menor 
quen-i. 

4.9 Como E[X] = np, Var(X) = np(1 - p) e sabemos que np = 6, temos np(1l - p) = 

2,4. Assim,1 -p = 0,4,0u p = 0,6,n = 10. Com isso, 


10 
4.10 Suponha que X,, i = 1,...,m, represente o número da i-ésima bola retirada. Então, 
PX<O=PX=skXão =<k,..., Am = k) 
= PM <P ShkPXm<k 
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Portanto, 


PX=g=PX=<k-PX=<k- n=(5) E (= *) 


n 


4.11 (a) Dado que o time A vença a primeira partida, ele vencerá a série se, a partir daí, 
vencer 2 partidas antes do time B vencer 3 partidas. Assim, 
“(4 
P(A vence|A vence primeiro) = > (;) pq — pp 
i=2 


(b) 


PEREnce pamela E P(A vence|A vence primeiro)P(A vence primeiro) 


P(A vence) 
4 
s (:) pH — py 
= i=2 
5 
a () p'qa — pp 
i=3 


4.12 Para obter a solução, condicione no time vencer ou não neste final de semana 


E 4 
0,53, () (0,406)! + 0,55, () Rue 
i=3 


i=3 


4.13 Suponha que C seja o evento em que os jurados tomam a decisão correta e Fo 
evento em que quatro dos juízes tem a mesma opinião que os jurados. Então, 
7 


7 ! . 
MO =>, (Jonas 


i=4 
Além disso, 


P(CF) 
PCI) = —— 
(CIP) PE) 


(1) 000,37 


(1) oni0,33 + (3) 030378 
= 


4.14 Supondo que o número de furacões possa ser aproximado por uma variável alea- 
tória de Poisson, obtemos a solução 


3 . 
> els pi 


i=0 


Soluções para os Problemas de Autoteste e Exercícios 561 


E[y] = > iPIX = D)/PIX > 0) 
i=1 
= E(X]/PIX > 0) 
o 
= 


416 (a) 1/n 
(b) Suponha que D seja o evento em que as garotas i e j selecionam garotos dife- 
rentes. Então 


P(Gi;G)) = P(G;G;|D)P(D) + P(G;G;|D9P(DS) 
nd — 1/n) 


n-1 


n3 
Portanto, 


n-—1 
P(GilG;) = E 


(c), (d) Como, quando n é grande, P(G|G,) é pequena e aproximadamente igual a 
P(G,), resulta do paradigma de Poisson que o número de casais tem aproxima- 
damente uma distribuição de Poisson com média 5);.4 P(G;) = 1. Portanto, 
P=eleP,=e!k! 

(e) Para determinar a probabilidade de que um dado conjunto de k garotas 
possua garotas que tenham todas elas formado pares, condicione na ocor- 
rência de D, onde D é o evento em que todas elas escolhem garotos diferen- 
tes. Isso dá 


P(Gi, --- Gi) = (Gi, Gu lD)P(D) + P(Gi, --- Gi lD9P(DS) 
= P(Gi, :-- Gi ID)P(D) 
pe (A — Dn -k+ 1) 


=( 
(1/n nt 
n! 
—n— nk 
Portanto, 
n ntn! 

| E P(Gi Gi) = (PG Gi = (n — Di — W!kink 
H<...<lk 


e a identidade da inclusão-exclusão implica 
n 
1-Po=PULG)=>(-D! 
k=1 


nin! 
(n — On — k)kn?k 
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4.17 (a) Como uma mulher i tem a mesma probabilidade de formar um par com qual- 

quer uma das 2n — 1 pessoas, P(W,) = sr T 

(b) Como, dado W;, a mulher i tem a mesma prepa idade de formar um par com 
qualquer uma das 2n-3 pessoas, P(WIW,) = = 3 

(c) Quando n é grande, o número de esposas que formam pares com seus MARas 
é aproximadamente uma variável de Poisson com média 31º, P(W;) = 5& 
= 1/2. Portanto, a probabilidade de que não ocorra tal par é aproximadamente 
iguala e” 


(d) Ele se fadas ao problema do pareamento. 


4.18 (a) É ) (9/19)2(10/19)5(9/19) = (3) (9/19)4(10/19) 
(b) Se W é o seu número final de vitórias e X é o número de apostas que ela faz, 
então, como ela terá ganhado 4 apostas e perdido X — 4, tem-se que 
W=20-5(X-4)=40-5X 
Portanto, 


ELW] = 40-5E[X] = 40-S[4/(9/19)] = —20/9 


4.19 A probabilidade de que uma rodada não resulte em alguém obtendo um resultado 
diferente dos demais é igual a 1/4, que é a probabilidade de que todas as três moe- 
das caiam no mesmo lado. 

(a) (1/4)(3/4) = 3/64 
(b) (1/4)! = 1/256 


4.20 Seja q = 1 - p. Então 


oo 


1. 
E(1/X] = 5. 59!p 


i=1 


4.21 Como à será igual a 1 com probabilidade p ou O com probabilidade 1 — p, veri- 
ficamos que ela é uma variável aleatória de Bernoulli com parâmetro p. Como a 


variância de tal variável aleatória é p(1 — p), temos 


ad ) = Var sa 
p p= Eh 


1 1 
) = ER Rudd b) = = AO 
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Portanto, 
Var(X) = (a— b)p(1-p) 


4.22 Suponha que X represente o número partidas que você joga, e Y, o número de 
partidas perdidas. 
(a) Após o seu quarto jogo, você continua a jogar até perder. Portanto, X — 4 é 
uma variável aleatória geométrica com parâmetro 1 — p. Assim, 


1 
E(X] = El4 +(X — 49]=4 + EX — 4]=4 + 1=p 
(b) Se Z representa o número de perdas que você tem nas primeiras 4 partidas, 
então Z é uma variável aleatória binomial com parâmetros 4 e 1 — p. Como 
Y=Z+1,temos 


E(Y]= EIZ+1]=ElZ]+1=40-p)+1 


4.23 Um total de n bolas brancas serão retiradas antes de m bolas pretas se e somente 
se houver pelo menos n bolas brancas nas primeiras n + m — 1 bolas retiradas 
(compare com o problema dos pontos, Exemplo 4j do Capítulo 3). Com X igual 
ao número de bolas brancas entre as primeiras n + m — 1 bolas retiradas, X é uma 
variável aleatória hipergeométrica. Com isso, obtemos 


a aid 
Px=m=5> PXx=9= 5 Asa 
I=n 1t=n sa) 


4.24 Como cada bola vai independentemente para a urna i com uma mesma probabi- 
lidade p,, verificamos que X, é uma variável aleatória binomial com parâmetros 
n=10,p=p; 

Note primeiro que X, + X, é o número de bolas que vão para a urna i ou j. En- 
tão, como cada uma das 10 bolas vai independentemente para uma dessas urnas 
com probabilidade p, + p, é possível concluir que X, + X, é uma variável aleatória 
binomial com parâmetros 10 e p; + p;. 

Pela mesma lógica, X, + X, + X, é uma variável aleatória binomial com parâ- 
metros 10 e p, + p, + ps. Portanto, 


10 
PX, + X2 + X3=7)= (5) + po + pa (pa + ps? 
4.25 Seja X, = 1 se a pessoa i achar o seu chapéu, e X, = O caso contrário. Então, 
n 
X=) X 
i=1 
é o número de pareamentos. Calculando esperanças, obtemos 


EX|=ED X]=> EXJ=) PMM=0=)1n=1 
t=] i=1 i=1 i=1 


onde a última igualdade é obtida porque a pessoa i tem a mesma probabilidade de 
ficar com qualquer um dos n chapéus. 
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Para calcular Var(X), usamos a Equação (9.1), que diz que 
n n 
ED] = 5 E(Xi] + DS EX] 
i=1 i=1 já 
Agora, para i = j, 


11 
EX] = PXG=1,X;=1) = P(X; NPOG = =1)=— 


n-—1 
Portanto, 
” 1 
EX?]=1 DAR 
Ee x as n(n — 1) 
i=l ja 
l+n(n- 1) ! 2 
=. n — ————— = 
n(n — 1) 
o que resulta em 
Var) =2=8=1 


4.26 Com q = 1 - p, temos, por um lado, 


P(E) = » P(X = 2i) 
i=1 


- 2i-1 
=> pq” 


So . 
= pa ta) 
i=1 
1 
117 
pq 4 
a-gdd+ra 1+g 


=D 


Por outro lado, 
P(E) = P(E|X = 1)p + P(EIX > Dag = gP(EIX > 1) 


Entretanto, dado que a primeira tentativa não é um sucesso, o número de tentati- 
vas necessárias para que ocorra um sucesso é 1 mais o número geometricamente 
distribuído de tentativas adicionais necessárias. Portanto, 


P(EIX>1)=P(X+1épar)=P(EJ=1-P(E) 
o que resulta em P(E) = q/(1 + q). 


CAPÍTULO 5 


5.1 Seja X o número de minutos jogados. 
(a) PIX>15])=1-P(X=15)=1-5(0,025) = 0,875 
(b) P[20< X< 35) = 10(0,05) + 5(0,025) = 0,625 
(c) PLX < 30) = 10(0,025) + 10(0,05) = 0,75 
(d) P(X > 36] = 4(0,025) = 0,1 
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s2()1l=fe"dx=c/(n +D)sc=n+41 
1 

DPX>M=n+Dfixd=aet =1- qm 
X 


5.3 Primeiro, vamos determinar c usando 


2 
def cxdx = 32c/5 => c = 5/32 
0 


(a) EX] = > fêxdx= 58 =5/3 
(b) ED] = & fo xódx = 5128 = 20/7 => Var(X) = 20/7 — (5/32 = 5/63 
5.4 Como 


1 
1 = [ (ax + bx)dx = a/2 + b/3 
0 
1 
0,6 a (ax? + bx)dx = a/3 + b/4 
0 


obtemos a = 3,6 e b = -2,4. Portanto, 
1/2 2 2 3,[1/2 
(a) PIX < 1/2) = f“(3,6x — 2,4x2)dx = (1,8x2 — 0,8x ho = 0,35 
(b) ELO] = fo (3,60 — 2,4x%)dx = 0,42 => Var(X) = 0,06 
5.5 Parai = 1,...,n, 
P(X =i)=Pfnt(nU)=i -— 1) 
=P(i-1=<nU <i 


5.6 Se você faz uma proposta x, 70 = x <140, então ou você ganhará a concorrência e 
terá um lucro de x — 100 com probabilidade (140 — x)/70, ou perderá a concorrên- 
cia e fará um lucro de 0, caso contrário. Portanto, o seu lucro esperado se você fizer 
uma proposta x é 


E — 100)(140 - x) = (MOR — x) — 14000) 


Derivando e igualando a 0, obtemos 
240-2x = 0 


Portanto, você deve fazer uma proposta de 120 mil reais. Seu lucro esperado será 
de 40/7 mil reais. 


5.7(a) P(U>0,1) = 910 
(6 PU>02U>0,1)=P(U>02/P(U>0,1)= 8/9 
()JPU>03U>02,0U>0,1]=P(U>03/P(U>0,2)= 78 
(d) PIU > 0,3) = 7/10 
A resposta para a letra (d) também poderia ter sido obtida multiplicando-se as 
probabilidades das letras (a), (b) e (c). 
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5.8 Suponha que X seja a nota do teste, e considere Z = (X — 100)/15. Note que Z é 
uma variável aleatória normal padrão. 
(a) P(X > 125] = P[Z > 25/15) = 0,0478 


b 
da P(90 < X < 110) =P(-10/15 < Z < 10/15) 


=P(Z <2/3])-PIZ<-2/3) 
=PZ<23)-[1-P(Z<2/3] 
= 0,4950 


5.9 Suponha que X seja o tempo de viagem. Queremos determinar x tal que 


PiX > x) = 0,05 

o que é equivalente a 

X — 40 x -— 40 

P = 0,05 
Ra: | 
Isto é, precisamos determinar x tal que 
— 40 
P |Z Ee |- 0,05 


onde Z é uma variável aleatória normal padrão. Mas 
PIZ > 1,645] = 0,05 
Logo, 
x — 40 


=1,645oux = 51,515 


Portanto, você não deve sair depois de 8,485 minutos após o meio-dia. 


5.10 Seja X o tempo de vida do pneu em unidades de milhares de km, e suponha que Z 
= (X—34)/4. Note que Z é uma variável aleatória normal padrão. 
(a) P(X > 40] = P(Z > 1,5) = 0,0668 
(OPBO<X<35S])=P--1<Z<ozs=P(Z<025)-P[Z>1]=0,44 


(9) P(X > 40X > 30)=P(X > 40)/P(X > 30) 


=P(Z > 1,5)/PIZ > —1) = 0,079 
5.11 Suponha que X seja o índice pluviométrico do próximo ano e que Z = (X - 


40,284. 
(a) PIX > 44] = P[Z > 3,8/8,4) = P[Z > 0,4524) = 0,3255 


(b) ( : Josessprosrasy 
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5.12 Suponha que M, e W, representem, respectivamente, os números de homens e 
mulheres nas amostras que ganham, em milhares de reais, pelo menos i por ano. 


Também, seja Z uma variável aleatória normal padrão. 


(a) 
PlWos = 70) = PlWos = 69,5) 
E I Was — 200(0,34) 69,5 — 200(0,34) | 


200(0,34)(0,66) «/200(0,34)(0,66) 


= P(Z = 0,2239) 


= 0,4114 
(b) 
P(Mas = 120) = P(Mos <= 1205) 
E | Mas — (200)(0,587) 120,5 — (200)(0,587) | 
/QUOS8N(04)  Q00(0,587(0,413) 
= P(Z < 0,4452) 
= 0,6719 
(e) 
PM» = 150) = PtM» = 149,5) 
= p| Ma — 200/0,745) 149,5 — (200)(0,745) | 
(200)(0,745)(0,255) «/(200)(0,745)(0,255) 
= P(Z = 0,0811) 
= 0,4677 
P(W>o = 100) = P(W> = 99,5) 
=| Woo — (200)(0,534) 99,5 — (200)(0,534) | 
/(200)(0,534)(0,466) «/(200)(0,534)(0,466) 
= P(Z = —1,0348) 
= =0,8496 
Portanto, 
PIM, = 150)P(W,, = 100) = 0,3974 
/5 


5.13 A propriedade de falta de memória da distribuição exponencial resulta em e* 


5.14 (a) e =e* 

(b) FG)-F(1) = e! 
(e) A(t) = 24? je? = 2t 
(d) Seja Z uma variável aleatória normal padrão. Use a identidade 


E[X] = fo PLX > x) dx para obter 
oo 
ElX] = ! e dx 
0 
=218 / Cera 
0 
=212/27P(Z > 0) 
= 7/2 
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(e) Use o resultado do Exercício Teórico 5.5 para obter 
2 ça 2 2 
E[X*] = [ 2xe”* dx=-e*| =1 
0 0 
Portanto, Var(X) = 1 — x/4. 
5.15 (a) PIX > 6) = expl— fo Midi) = 345 
(b) 

P(X <8X>6=1-PX>BSX > 6) 
=1-P(X>8y/P(X > 6) 
=1— 5 e3AS 
= (0,8892 

5.16 Parax > 0, 

Fxt0) — PU/X = x) 
=PX=<0+4 PXo=tI/x) 
=1/2+1 - Fx(1/x) 

O cálculo da derivada fornece 
fix) =x2fx(1/x) 
» 1 
Cad + dp) 
= fx(x) 
A demonstração para x < O é similar. 


5.17 Se X representa o número das primeiras n apostas que você ganha, então a quan- 
tia que você ganhará após n apostas é 


35X -(n-X)=36X-n 


Logo, queremos determinar 


p=P(86X-n>0)=P[X> n/36) 


onde X é uma variável aleatória binomial com parâmetros n e p = 1/38. 
(a) Quando n = 34, 


p=P(X => 1) 

=P(X > 0,5) (acorreção da continuidade) 

=| X- 34/38 05 — 34/38 | 
v34(1/38)(37/38) /34(1/38)(37/38) 

-P| Ef nitia Ei 04020) 
34(1/38)7/38) 

= 4(0,4229) 

= 0,6638 


Como você estará na frente após 34 apostas se ganhar pelo menos 1 aposta, a 
p p p p 
probabilidade exata neste caso é 1 — (37/38)” = 0,5961). 
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(b) Quando n = 1000, 
p=PIX > 275) 
7 X — 1000/38 27,5 — 1000/38 
E | SST - mts 
= 1 — 9(0,2339) 
x 0,4075 


A probabilidade exata — isto é, a probabilidade de que uma variável aleatória 
binomial com n = 1000 e p = 1/38 seja maior que 27 — é igual a 0,3961. 


(c) Quando n = 100.000, 
p=P(X > 27775) 
o X — 100000/38 2777,5 — 100000/38 
E /100000(1/38)(37/38) E RES 
=1—- d(2,883) 
= 0,0020 


A probabilidade exata é neste caso igual a 0,0021. 
5.18 Se X representa o tempo de vida da pilha, então a probabilidade desejada, P(X > 
s + 4X > t), pode ser determinada da maneira a seguir: 
P(X >s+X>8 
P(X IX >])=>————— 
dA a e P(X > 1) 
PIA > Ad] 
P(X > 1) 
P(X>s+| pilha é tipo 1)p; 
+P(X>s+ pilha é tipo 23p> 
P(X>:| pilha é tipo 1)p; 
+P(X> pilha é tipo 2)p> 


e SDpy + e USD po, 
eMtpy + Mp, 


Outra abordagem é condicionar diretamente no tipo de pilha e então usar a pro- 
priedade da falta de memória das variáveis aleatórias exponenciais. Isto é, pode- 
ríamos fazer o seguinte: 


PX>s+UX>9)=PX>s+dX > ttipol)Pítipo 1X > +) 
+ P(X > s+ X > tipo 2)Pítipo 2X > 1) 
=eMSPl(tipo 1X > 1) + e *SPítipo 2X > 1) 


Agora, para i = 1,2, use 
Pitipo ,X > 1) 


Pitipo ilX > )= RE 


P(X > tltipo ilp; 
“ P(X > tfitipo 1)p, + P(X > tltipo 2)p> 
ne ip; 
— eMipy + ep, 
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5.19 Seja X, uma variável aleatória exponencial com média i, i = 1,2. 
(a) O valor de c deve ser tal que P(X, > c) = 0,05. Portanto, 


e *=0,05 = 1/20 
ou c = log(20) = 2,996. 
(b) i 
PX>c=e?=-—— = 02236 
( 2 ) 20 
5.20 (a) 
E((Z —- )]= RE te?! dx 
ê —00 
PA 
=—— x -— Je dx 
27 dr : ) 

E —x2/2 = —x2/2 

=—— xe dx — — ce dx 
27 f 
1 —x2/2 100 

=——— e — c(i — dD(c)) 

v2a É 

1 en 
=——e — (1 — dD(c)) 

2x 


(b) Usando o fato de que X possui a mesma distribuição que u + oZ, onde Z é 
uma variável aleatória normal padrão, obtemos 


EX — 9] = Elu + 0Z — ot] 


-effo(e- 8) 


= efe = ty] 
o 


-oEl(z E | 


EP — a(1 — v(0)| 


- 1 
Ria E 


onde a = É, 
o 


CAPÍTULO 6 
61(a)3C+6C=1>C=19 
(b) Seja p(i,)=P[X=i,Y=;). Então 
p(1,1) = 4/9,p(1,0) = 2/9, P(0,1) = 1/9, p(0,0) = 2/9 


(o) 2 E Co 492/96 


Soluções para os Problemas de Autoteste e Exercícios 571 


(12)! 
(413 

12/42 E E 
0 ( ) CIP 


6.2 (a) Com p, = P(XYZ = j), temos 


(d) 5 (1/3)12 


PS P,=Pa=Pp=1/4 
Portanto, 
ELXYZ]) =(6+2+4+12)4=6 
(b) Com q, = P(XY + XZ + YZ = j), temos 


GQn=95>G)h = — 1/4 
Portanto, 
EXY+AZ+YZ]=(11+5+8+16)/4=10 


6.3 Nesta solução, fazemos uso da identidade 


[6,0] 
[ ex dx =n! 
0 


que é obtida porque e“x“/n!,x > 0, é a função densidade de uma variável aleató- 
ria gama com parâmetros n + 1 e A,e sua integral é iguala 1. 


(a) 
oo y 
1=cf e" | (y-— xdxdy 
9 = 
[6,0] 
=C / e2y2 dy = 4C 
0 


Portanto, C = 1/4. 
(b) Como a densidade conjunta é diferente de zero somente quando y > xe y > 
—x, temos, para x > 0, 


Parax <0, 


= (-2xe + e9/4 
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OhWD=1 LO —- ndr= ye” 
(d) 


[0.0) 0 
ELX] = ; !/ xe dx + JÁ (e + xe) às 


1 [6.6] 
=— É — / Qye” + ye”) ày| 
4 0 
1 
E | RS UR | | 
il ] 


()EV]=7h Pe"dy=3 


6.4 As variáveis aleatórias multinomiais X,, i = 1,..., r, representam os números de 
cada um dos tipos de resultados 1,...,r que ocorrem em n tentativas independentes 
quando cada tentativa leva a um desses resultados com respectivas probabilida- 
des p,,..., p,. Agora, digamos que uma tentativa leve a um resultado de categoria 
1 se ela tiver levado a qualquer um dos resultados tipo 1,..., r;; digamos que a 
tentativa leve a um resultado de categoria 2 se ela tiver levado a qualquer um dos 
resultados tipo 7, + 1,...,r, + r,;e assim por diante. Com essas definições, Y,,..., Y, 
representam os números de resultados das categorias 1,2.,... k quando n tentativas 
independentes que resultam cada uma delas em uma das categorias 1,..., k com 


respectivas probabilidades Es 
ção, tal vetor tem uma distribuição multinomial. 
6.5 (a) Fazendo p, = P(XYZ = j), temos 
p, = 1/8,p, = 3/8,p, = 3/8,p, = 1/8 
(b) Fazendo p, = P(XY + XZ + YZ = j), temos 
ps = 1/8,p, = 3/8,ps = 3/8,p = 1/8 
(c) Fazendo p, = P(Xº + YZ = j), temos 
p= 1/8,p; = 1/4,p, = 1/4,p, = 1/4,p; = 1/8 


pj; i = 1,...,k, são realizadas. Mas, por defini- 


6.6 (a) a 
1 = [ À (x/5 + cy)dy dx 
0 J1 


1 

= (4x/5 + 12c) dx 
0 

=12c + 2/5 


Portanto, c = 1/20. 
(b) Não, não é possível fatorar a densidade. 


(c) 
1 5 
Px Y sd / (154 y/20) dy de 
O J3-x 


1 

= / [2 + x)x/5 + 25/40 — (3 — x)?/40] dx 
0 

= 1/5 + 1/15 + 5/8 — 19/120 = 11/15 
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6.7 (a) Sim, é possível fatorar a função densidade conjunta. 
Di =xfeydy=2x,0<x<1 
O hW=yhxdr=y/20<y<2 


d 
o PX <xY <y=PX<xP(Ya<oy) 


= mín(1,x?) mín(1,y2/4), x>0,y>0 
(e) Ely] = fi y2/2dy = 4/3 
f 
(6) 1 1-x 
px+y<n=[x[ ydydx 
0 0 


1 
=5| x(1 — x)? dx = 1/24 
2 Jo 


6.8 Suponha que T, represente o instante de ocorrência de um chogue do tipo i,i = 1, 
2,3.Paras > 0,t>0, 


PX, >sX>)=PTo>sT >tT3 > máx(s,0)) 
=P(T,i> 9PT > )PIT; > máx(s,?)) 
= exp(—A1s) exp(—A2t) exp(— As máx(s,1)) 
= exp(—(Ajs + Azt + As máx(s,1))) 


6.9 (a) Não, classificados em páginas com muitos classificados têm probabilidade me- 
nor de serem escolhidos do que aqueles em páginas com poucos classificados. 
1 nc) 
ao 
m 
> E 


(c) = =n/n, onden = >ontd/m 


. i=1 
(DA — np PO 1 = nn! y(nm) 
mn nt(i) 
e | iara E 
E Am = n/n) A 


(£) O número de iterações é uma variável aleatória geométrica com média n,/n. 
6.10 (a) PX = i)=1/m, i=1,.,m. 
(b) Passo 2. Gere uma variável aleatória U uniforme no intervalo (0,1). Se U < 
n(X)n, siga para o passo 3. Caso contrário, volte para o passo 1. 
Passo 3. Gere uma variável aleatória uniforme U no intervalo (0, 1) e sele- 
cione o elemento na página X na posição [n(X)U] + 1. 


6.11 Sim, elas são independentes. Isso pode ser visto facilmente se perguntarmos, de 
forma equivalente, se X,, é independente de N. Mas isso é de fato verdade, já que 
saber quando ocorre a primeira variável aleatória maior que c não afeta a distri- 
buição de probabilidade de seu valor, que é uniforme em (c, 1). 
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6.12 Suponha que p, represente a probabilidade de se obter i pontos em uma única 
jogada de dardo. Então 
p30 = 7/36 
pzo = 47/36 — p3o = m/12 
pio = 97/36 — pro — p3o = 57/36 
Ppo=1 — pio — po — pyo=1 — 7/4 
(a) m/12 
(b) 7/9 
(c) 1 — m/4 
(d) m(30/36 + 20/12 + 50/36) = 357/9 
(e) (ma) 
(D Mm/36)( — m/4) + 2(m/12)(57/36) 


6.13 Seja Z uma variável aleatória normal padrão. 


(a) 
4 
i 3x -6 

a —6 

P dos nh=epjEt==. ss so 

[> | 24 24 

= P(Z > —1,2247) = 0,8897 

(b) 


4 2 
fãs sy dus = PI MS 
= E 


. ppt , en] 
= P(Z >0,5774) = 0,2818 


(c) 


4 
fox > mt =s] =P(X, + X3 + X4 > —S5) 


i=1 
XM + X + X — 45 
=P > —9,5/v'18 


= P(Z > —2,239) = 0,9874 


6.14 No desenvolvimento a seguir, € não depende de n. 
PN =n|X =x) = fyntinPIN =n)/fy6) 
1 
= end A n-1 1 Es n—1 
Capa — p) 
=CAd — porta 1)! 
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o que mostra que, dado que X = x, N — 1 é uma variável aleatória de Poisson com 
média A(1 — p)x. Isto é, 
PN=nX=x)=PN-1l=n-X=+x) 
= PA — poriia — Din=1. 


6.15 (a) O Jacobiano da transformação é 


10 
Ad 


Fa 
Como as equações u = x,v = x + y implicam que x = u,y = v— u, obtemos 
fuduv)-fekuv-u)=1, 0O<u<t, 0O<v-u<l 


ou, equivalentemente, 
fuu,v)=1, máx(v-1,0)<u< mín(v,1) 


(b) Para0<v<1, 
v 
pos dus 
0 
Paral<v=?2, 


1 
fro= [ du=2-—v 
v—1 


6.16 Seja U uma variável aleatória uniforme no intervalo (7 11). Se o seu lance for x, 
75x=< 10,a probabilidade de que ele seja o maior é dada por 


3 
rs at EA 
cw «ap = (P| E nd ; |) - (E 7) 
Portanto, o seu lucro esperado — chame-o de E[G(x)] — se o seu lance é x é dado 
por 


EIG(9] = 46: — DÊGIO — 5) 


Essa função é maximizada quando x = 37/4. 
6.17 Seja i,, i,...., i, uma permutação de 1,2.,...,n. Então, 
PX=i,Ão=b,..Xn=in=PM=iyPMo=i)-PX,=in) 
= PiDi' Pin 
=pPiPp2::Pn 


Portanto, a probabilidade desejada é n!p,p,... p,, que reduz-se a E quando todos 
Os p;'s são iguais a 1/n. 


n n 

6.18 (a) Como >) X; = >: Yi; obtemos N = 2M. 
i=1 i=1 

(b) Considere as n — k coordenadas cujos valores Y são iguais a 0, e chame-as de 

coordenadas vermelhas. Como as k coordenadas cujos valores X são iguais a 


1 têm a mesma probabilidade de serem qualquer um dos . conjuntos de k 
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coordenadas, resulta que o número de coordenadas vermelhas entre essas k 
coordenadas tem a mesma distribuição que o número de bolas vermelhas ob- 
tidas quando alguém sorteia k bolas de um conjunto de n bolas das quais n — k 
são vermelhas. Portanto, M é uma variável aleatória hipergeométrica. 


(e) EIN] = E[2M] = 2E[M] = (n- 
(d) Usando a fórmula para a variância de uma variável aleatória hipergeométrica 
dada no Exemplo 8j do Capítulo 4, obtemos 


Var(N) = 4 Var(M) = 42 =ka — k/n)(k/n) 


n 
6.19 (a) Note primeiro que S,- S, = >) Z;é uma variável aleatória normal indepen- 
i=k+41 
dente de S, com média O e variância n — k. Consequentemente, dado que $, = y, 
S, é uma variável aleatória normal com média y € variância n — k. 

(b) Como a função densidade condicional de S, dado que S, = x possui argumen- 
to y, tudo o que não depende de y pode ser considerado uma constante (por 
exemplo, x é considerado uma constante). No desenvolvimento a seguir, as 
grandezas C, i = 1,2,3,4 são constantes que não dependem de y: 


sen) 
Ísusa O) = E 
1 
= CifsalSk (ey)fs; (0) (ond C = fg 5) 
= comerem Dog 
v2nvn — k 27 N'k 


G-)2 y 
Zn — k) 2k 


=C n kN? 
paso 2k(n — k) (» 2) 


Mas a última expressão é a função densidade de uma variável aleatória normal 
ok ao kn — k) 
com média —x e variância ————. 
n 
6.20 (a) 
P(Xs > X1 |X4 =— máx(X,, aiede + X5)]) 
P(Xs > Xi, X = máx(X,, ipa » X5)) 
P(X, = máx(X,, EA »X5)) 
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= P(Xe = máx(Xi,...,X6), X1 = máx(Xi,...,Xs)) 
- 1/5 


11 1 
EO a 


Logo, a probabilidade de que X, seja o maior valor é independente de qual é 
o maior dentre os outro cinco valores (claramente, isso não seria verdade se os 
X;s tivessem distribuições diferentes). 


(b) Uma maneira de resolver este problema é condicionar em X > X,. Agora 
P(X,> XIX, = máx(X,...,X), X,>A]=1 


Também, por simetria, 


PX,> XIX, = máx(X,..., NX), AX <A)= E 
Da letra (a), 
PX,> XIX, = máx(X,..., X9) | = : 
Logo, condicionando em X, > X,, obtemos 
END UR, 
P(X, > XX, = máx(X,...., X9)) = 6 Es SD 


CAPÍTULO 7 


7 ds EURO 
i=1 
(bPX=)=P(mUJ=i-D)=Pfi-lIsemU<i)j=I/m ii=l,m 
m mm E mai = 
o Elao]=Emgtt=1=D mad 


7.2 Faça 1, = 1 se a j-ésima bola retirada for branca e a (j + 1)-ésima for preta, e 1, = 
O caso contrário. Se X é o número de vezes nas quais uma bola branca é imediata- 
mente seguida por uma bola preta, então podemos representar X como 

n+m—l1 


de Sic 
j=1 


Logo, 
n+4m—l 
EX]= 5 El] 
j=1 
ntm— 


= 3. P(j-ésima bola retirada é branca, (j + 1)-ésima é preta) 
j=1 
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n4m-1 
D P(j-ésima bola retirada é branca)P((; + 1)-ésima bola retirada é branca) 
j=1 

n+m-l 


H 


Data 
““ntmym-l 
j=l 


nm 


n+m 


O desenvolvimento anterior usou o fato de que cada uma das n + m bolas tem 
a mesma probabilidade de ser a j-ésima bola retirada e, dado que esta bola seja 
branca, cada uma das demais n + m — 1 bolas tem a mesma probabilidade de ser a 
próxima bola escolhida. 


73 Numere arbitrariamente os casais e então faça 1, = 1 se o casal número j,j = 1,..., 
10, se sentar na mesma mesa. Então, se X representa o número de casais sentados 
na mesma mesa, temos 


10 
X= Sd 

j=1 
então 

10 

EX] = >, EU) 

j=t 

(a) Para computar E[[] neste caso, considere a esposa número j. Como cada um 


dos a grupos de tamanho 3 que não a incluem tem a mesma probabilidade 


de completar a sua mesa, concluímos que a probabilidade de que seu marido 


esteja em sua mesa é 
1/18 
1/32 3 


19) 19 
3 
Portanto, E[Z]] = 3/19 e assim 
E[X] = 30/19 


(b) Neste caso, como os 2 homens na mesa da esposa j têm a mesma probabilidade 
de serem qualquer um dos 10 homens, tem-se que a probabilidade de que um 
deles seja o seu marido é igual a 2/10, assim 


EU] = 210e EX] =2 


7.4 Do Exemplo 2i, sabemos que o número esperado de vezes que um dado precisa 
ser rolado até que todas as suas faces apareçam pelo menos uma vez é 6(1 + 1/2 + 
1/3 + 1/4 + 1/5 + 1/6) = 14,7 Agora, se fizermos com que X represente o número 
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6 
total de vezes em que a face i aparece, então, como 3: X; é igual ao número total 
de jogadas, temos i=1 


6 6 
147=E|3 X|=> ElX] 
i=1 i=1 


Mas, por simetria, E[X,] será o mesmo para todo i, e com isso resulta da expressão 
anterior que E[X,] = 14,7/6 = 2,45. 


7.5 Faça 1, = 1 se ganharmos 1 quando a j-ésima carta for virada, e 7, = O caso contrá- 
rio (por exemplo I, será igual a 1 se a primeira carta virada for vermelha). Portan- 


to, se X é o nosso número total de vitórias, então 
n n 
EX|=E|> 6|=> El] 
j=1 j=1 


Agora, Í, será igual a 1 se j cartas vermelhas aparecerem antes de j cartas pretas. 
Por simetria, a probabilidade deste evento é igual a 1/2; portanto, E[Z] = 1/2 e 
ELX] = n/2. 

7,6 Para ver que N <n-—1 + 1 note que, se todos os eventos ocorrerem, então ambos 
os lados dessa desigualdade serão iguais a n. Do contrário, se eles não ocorrerem, 
então a desigualdade reduz-se a N = n-— 1,0 que é claramente verdade nesse caso. 
Calculando as esperanças, obtemos 


EWN|<n-1+ EM 


Entretanto, se fizermos 1, = 1 se 4, ocorrer, e I, = O caso contrário, então 


EIN|=E|> 1) => El]=5 PA) 
i=1 i=1 i=i 


Como Ef7] = P(A,,...,A,),o resultado é obtido. 


7.7 Imagine que os valores 1,2.,...,n sejam ordenados e que todos os k valores selecio- 
nados sejam considerados especiais. Do Exemplo 3e, a posição do primeiro valor 
n-k n+1 
k+1 k+U 
Para um argumento mais formal, note que X = ; se nenhum dos j — 1 menores 
valores forem escolhidos. Portanto, 


o, o) 
k ed 
PRE = 


especial, que é igual ao menor valor escolhido, tem média 1 + 


(O) (2) 


o que mostra que X tem a mesma distribuição que a variável aleatória do Exem- 
plo 3e (com uma mudança de notação na qual o número total de bolas agora é n, 
e o número de bolas especiais é À). 
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78 Seja X o número de famílias que saem depois da família Sanchez. Numere arbitra- 
riamente todas as N — 1 famílias que não sejam a família Sanchez e faça /, = 1,1 = 
r=N-1,se a família r sair depois da família Sanchez. Então, 


N-1 
dee 
r=1 


Calculando as esperanças, obtemos 
N-1 
ELX] = >, Plfamília » sai depois da família Sanchez) 


r=1 


Considere agora qualquer família que não seja a família Sanchez que tenha des- 
pachado k malas. Como cada uma das k + ; malas despachadas por essa família ou 
pela família Sanchez tem a mesma probabilidade de ser a última das k + j malas 
a aparecer, a probabilidade de que essa família saia depois da família Sanchez é 
dada por k/(k + ;). Como o número de famílias (que não são a família Sanchez) 
que despacham k malas é n, quando k * j, ou n,- 1 quando k = j, obtemos 


kn 1 
E ca pus 


79 Suponha que a vizinhança de qualquer ponto na borda do círculo seja definida 
pelo arco que começa naquele ponto e se estende por um comprimento 1. Consi- 
dere um ponto uniformemente distribuído na borda do círculo — isto é, a proba- 
bilidade de que este ponto esteja situado em um arco específico de comprimento 
x é x/27 — e suponha que X represente o número de pontos localizados em sua 
vizinhança. Com f, = 1 se o item número j está na vizinhança do ponto aleatório, e 
I = O caso contrário, temos 


19 
Xe 555; 
j=1 


Calculando as esperanças, obtemos 
19 
EX] = >. P(item j está localizado na vizinhança do ponto aleatório) 
PA 
Mas como o item j estará localizado em sua vizinhança se o ponto aleatório estiver 
sobre o arco de comprimento 1 que sai do item j no sentido anti-horário, temos que 


1 
Pt(item j está localizado na vizinhança do ponto aleatório) = 27 
x 


Portanto, 


1 
EpI= >.3 


Como E[X] > 3, pelo menos um dos valores possíveis de X deve exceder 3, o que 
demonstra o resultado. 
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710 Se g(x) = x, então 
1 1 
g (1) = 52, 80) = E Rd 
Assim, a expansão em série de Taylor de x em dá 
1 1 
VX = A + 5X == RS a 
Calculado as esperanças, obtemos 


EIN'X] = A + SAPEIX AE SAS PEL AA 


1 
=VA — AP 

8 

1 
EA ss A 

8 


Portanto, 


Var(VX) = E[X] — (EI X)? 
1 2 
ZA — (va — qe) 


a 1/4 


7,11 Numere as mesas de forma que as mesas 1,2 e 3 possuam 4 cadeiras, e as mesas 4, 
5,6 7 possuam duas cadeiras. Além disso, numere as mulheres e considere X, pi 
1se a mulher i estiver sentada com o seu marido na mesa j. Observe que 


ElXil= (60) nd jeto 


20 95” 
4 


1 1 
ElX;j]= >> = To» 1=4,5,6,7 


20 190" 
2 


Agora, X representa o número de casais que estão sentados nas mesmas mesas. 
Com isso, temos 


10 7 
EX]=E|3 5. X 
i=1j=1o 
22 3 19. 7 


=5 SEX + >, EX 


= j= i=1 j=4 
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712 Faça X, = 1 se o indivíduo i não recrutar ninguém, e X, = O caso contrário. Então. 


E[X,;] = Pfi não recruta ninguém dei + 1,i + 2,...n) 


E e n-2 
CE EA n-1 
E dai: 
“n-1 


Portanto, 


a Cii-1l n 
E|D,% RL o 
i=1 i=1 


Da equação anterior, também obtemos 


csbedif BEAN ie 
Vartão = 555 (1 —)- (n — 172 


Agora, para i <j, 


RR Ss deep. n-—3 

a far j-ljj+1n-1 
Mi dgr=0) 
nn —) 


Logo, 


RA a no DR ad 
CM =D n- In-—1 
(i— DG —n) 


“n-Da-1? 


Portanto, 


ar (5x) - E Vert + is 3 Cov(X;, X;) 
i=1 


i=1 j=i+1 


(i e = (i— DG —n) 
1 n—i) Ob pp ne Ra 


= -12 
at ja alga son 


dis do == Dn 5) 


n—1 
1 | Ea 
Redes mo tie liredsa 


713 Considere X, = 1 se a i-ésima trinca for formada por um de cada tipo de jogadores 


CE 
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Portanto, para a letra (a), obtemos 
3 
E|5/X|=6/7 
i=1 


Resulta da equação anterior que 
Var(X;) — (2/7)(1 — 2/7) = 10/49 


Também, para i £ j, 
ELGX] = PG =1,X=1) 
= P(X; = DPX; = UX; = 1) 


DOG) 
6) 6) 
= 6/70 
Portanto, obtemos para a letra (b) 


3 3 
Var [5] X|=5 Var(X) + 255; Cov(X,X) 
i=1 i=1 


j>l 
4 
= 30/49 + 2(5) (5 z 2) 
32 
— 490 


714 Seja X, i = 1,..., 13, iguala 1 se a i-ésima carta for um ás e O caso contrário. Consi- 
dere Y, = 1 se a j-ésima carta, j = 1,..., 13, for do naipe de espadas, e suponha que 
i seja O caso contrário. Agora, 


n n 
Cov(X,Y)=Cov| 5 X,) Y; 
i=1 j=1 


n n 
= so a Cov(Xi;, Y;) 
i=1 j=1 


Entretanto, X, é claramente independente de Y, porque saber o naipe de uma 
determinada carta não fornece informações sobre o seu tipo (se é um ás, um dois, 
etc.) e portanto não afeta a probabilidade de que uma outra carta específica seja 
um ás. Mas, formalmente, suponha que 4,,, 4,,, A,q € A, Sejam os eventos em que, 
respectivamente, a i-ésima carta é de espadas, copas, ouros e paus. Então 


1 
Pl; = 1) = (PlYj= UAis) + P(Y;= Ain) 
+ PlY; = UAia) + Pl = HAio) 


Mas, por simetria, temos 


P(Y; = 1Ais) = PlY; = Ain) = P(Y; = HAia) = PY; = 1Aio) 
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Portanto, 
P(Y; = 1) = PY; = 1Ais) 
Como a expressão anterior implica que 
PWY;=1)=P(Y;= 14) 


vemos que Y,e X, são independentes. Portanto, Cov(X,, Y;) = 0, e assim Cov(X, 


Y=-0. 
As variáveis aleatórias X e Y, embora sejam não correlacionadas, não são 
independentes. É possível concluir isso, por exemplo, a partir de 


PY =13X=4]=0P[Y=13) 


7.15 (a) Seu ganho esperado sem qualquer informação é 0. 
(b) Você deveria dar o palpite “cara” se p > 1/2,e “coroa” caso contrário. 
(c) Condicionando em V, que é o valor da moeda, obtemos 


1 
Elganho] = [ Elganho|V = pJdp 
ap 1 
= UA — p) — Ip)ldp + [ [1p) — 14 — pldp 
0 1/2 
= 1/2 


7.16 Dado que o nome escolhido aparece em n(X) posições diferentes na lista, e como 
cada uma dessas posições tem a mesma probabilidade de ser escolhida, obtemos 


EUINÇO] = PU = Un(2)) = Un(X) 
Portanto, 
E(M) = E[1/n(X)] 
Logo, E[mi] = Elmin(X)] = d. 


7.17 Fazendo X, = 1 se uma colisão ocorrer quando o i-ésimo item é guardado, e X, = 
O caso contrário, podemos expressar o número total de colisões X como 


m 
É DO é 
i=1 
Portanto, 
m 
E[X] = > ELI] 
i=1 


Para determinar E[X,], condicione na prateleira na qual o item é colocado. 


EX] = a E[X;| colocado na prateleira ;]p; 
j 
= a P(i causa colisão|colocado na prateleira j]p; 


j 
=50-d- pp; 
j 


=1-5S4 — pop; 


J 
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A penúltima igualdade usou o fato de que, tendo como condição a colocação do 
item i na prateleira j, esse item causará uma colisão se qualquer um dos i — 1 itens 
anteriores tiver sido colocado na prateleira j. Logo, 
m hn 
Eb)=m-55a - pp; 
i=1 j=1 


Trocando a ordem da soma, obtemos 


EX)=m-n+54 -p” 
j=1 


Olhando para o resultado, percebemos que poderíamos tê-lo deduzido mais facil- 
mente ao calcular as esperanças de ambos os lados da identidade 


número de prateleiras não vazias = m — X 


O número esperado de prateleiras não vazias é então obtido definindo-se uma 
variável indicadora para cada prateleira (igual a 1 se a prateleira não estiver vazia 
e igual a O caso contrário) e em seguida calculando-se a esperança da soma dessas 
variáveis indicadoras. 


718 Suponha que £ represente a extensão da série inicial. Condicionando no primeiro 
valor, obtemos 


E[L] = ElLlprimeiro valor é 1] aa ElLlprimeiro valor é 0] pla, 
n+m n+m 

Agora, se O primeiro valor é 1,a extensão da série será a posição do primeiro 
zero quando considerarmos os n + m — 1 valores restantes, dos quais n — 1 são 
1'sem são 0's (por exemplo, se o valor inicial dos n + m — 1 valores restantes 
for igual a 0, então L = 1). Como temos um resultado similar se o primeiro 
valor for um 0, obtemos, da equação anterior e usando o resultado do Exemplo 


3e, que 
n+m n n+m m 
EL] = + 
m+1In+m n+In+m 
n m 


HR Col 


719 Suponha que X seja o número de jogadas necessárias para que ambas as caixas 
sejam esvaziadas e Y seja o número de caras nas primeiras n + m jogadas. Então, 
n+m 
SS eMxIy=PPW=i 
i=0 
nm 
Sexy =i É E a Jria (à 


i=0 


Hx] 


Agora, se o número de caras nas primeiras n + m jogadas é i, i = n, o número 
de jogadas adicionais é igual ao número de jogadas necessárias para que n-i 
caras adicionais sejam obtidas. Similarmente, se o número de caras nas primei- 
rasn + m jogadas é i, i > n, então, como haveria um total den + m-i<m 
coroas, o número de jogadas adicionais é igual ao número necessário para que 
i—n caras adicionais sejam obtidas. Como o número de jogadas necessárias 
para que se obtenham ;j resultados de um tipo particular é uma variável alea- 
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tória binomial negativa cuja média é a divisão de j pela probabilidade daquele 
resultado, obtemos 


say = DD ET(PAM ia — pr 


i=0 


ari pts 
; fes n+m-i 
RE ( Ji p) 


i 
i=n+4l Pp 


7.20 Calculando as esperanças de ambos os lados da identidade fornecida na dica, ob- 
temos 


EIX"] = ln nf xxx) ax 
a o Ep" Iy(o)] dx 
=n / Cx LEly(o] dx 
=n À “IF dx 
0 


O cálculo da esperança no lado de dentro da integral é justificado porque todas as 
variáveis aleatórias 1(x),0 < x < o, são não negativas. 


721 Considere uma permutação aleatória [,,..., , que tem a mesma probabilidade de 
ser qualquer uma das n! permutações. Então, 


Elar, 64) = = DR lagar]; = kJPU; =k) 
= SD axElar,, Hj = k] 
k 
1 : 
A E du Pla =ilh=+) 
E n(n = 1) pda 


izk 


= re 1 pm ax) 


< 0 


onde a igualdade final foi obtida a partir da hipótese de que 3º, a; — 0. Como a 
equação anterior mostra que 


n 
DIA; 10 
j=1 
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conclui-se que deve haver alguma permutação i,....,i, para a qual 
n 
> Aida < 0 
j=1 


722 (a) EXI= A, +A,EX]I=S A +A, 


b 
(5) Cov(X,Y) = Cov(X, + X2,X2 + X3) 


= Cov(X,,X2 + X3) + Cov(X,,Ã + Xa) 
= Cov(X>, X2) 
= Var(X) 
=» 
(c) Condicionando em X,, obtemos 


PX=iY=jj= >, Px =;Y=X=WPM=k) 

k 

= > PM =i- kX3=j-— kXo = ke Éh! 
k 

=5 PM =i-kh=)- kje A Ak jk! 
k 

= > PM =i-— WPDO=; — kje kk! 
k 


mín(ij) i-k jk k 
—M M —A3 As —A2º2 A 


So Sao A 


7.23 


dai (2u7» )- Cov(E; Xi Dj Y) 


[Var(E;X)Var(S; Y;) 
5; 5; Cov(X;, Yp 
 lnozno? 
>; Cov(X Yi) + Di opa Cov(X;, Y;) 


noxoy 


npoxoy 
= nox0y 
=p 


onde a penúltima igualdade usou o fato de que Cov(X, Y)) = po,0,. 
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7.24 Seja X, = 1 se a i-ésima carta escolhida for um ás,e X, = O igual a zero caso contrá- 


rio. Como 


3 
X= 3% 
i=1 
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e E(X] = P(X, = 1) = 1/13, obtemos E[X] = 3/13. Mas, com A sendo o evento em 
que o ás de espadas é escolhido, temos 


EX] = E(X Ri + E[XIAS]P(AS 
= EL IAJÊ 5 + EXIATS 


3 49 
= ELXIAIS + SE|D XIIA 


do e Mãe 
= ELXIAS os 2 E[X;A'] 
9,3 
2 51 
Usando E[X] = 3/13, obtemos o resultado 


3 
= EMXIAlS + 


52/3 49 3 19 
X|A|= — — = = 
BIA 3 (5 52 3) 17 RIO 
Similarmente, fazendo L ser o evento em que pelo menos um ás é escolhido, te- 
mos 
E[X] = ELXIL]P(L) + ERXILIPLS) 
= E(XIL]P(L) 
48.47. 46 
SB] (1 NE Eis 50) 
Logo, 
3/13 
52:51:50 


Outra maneira de resolver este problema é numerar os quatro ases, com o ás de 
espadas recebendo o número 1, e então fazer Y, = 1 se o ás número i for escolhido 
e Y, = O caso contrário. Então, 


EMXIAJ=E|> Ylrn=1 


4 
=1+ 5 EliYi=1] 
i=2 
deniafiisi ade 19/17 
de a 


onde usamos o fato de que, dado que o ás de espadas seja escolhido, as outras 
duas cartas têm a mesma probabilidade de formar qualquer par entre as 51 cartas 
restantes; então, a probabilidade condicional de que qualquer carta específica (di- 
ferente do ás de espadas) seja escolhida é igual a 2/51. Também, 


4 
E(XIL] = |» Y; a = 3 ELL]=4PRA = IL) 


i=1 


Como 
P(A) P(A) 3/52 


obtemos o mesmo resultado anterior. 
725 (a) EMX =x =PlZ<XMX=x)=P(Z<xX=x=P|Z<sx)= (x) 

(b) Resulta da letra (a) que E[I|X] = P(X). Portanto, 

E(1 = ELE(IMX]) = EP] 

E o resultado é obtido porque El] = Pl =1]=P(Z< 2X). 
(c) Como X - Z é normal com média y e variância 2, temos 
P(X > B=P(X-—-Z>o0) 
X-Z>-uo 
E— > 
2 2 


589 


Soluções para os Problemas de Autoteste e Exercícios 


7.26 Seja N o número de caras nas primeiras n + m -1 jogadas. Suponha que M = 
máx(X, Y) seja o número de jogadas necessárias para se acumular pelo menos n 


caras e pelo menos m coroas. Condicionando em N, obtemos 
E(M] = > ELMIN = JPIN = à) 
i 


n-1 nt+m-—l 
=S EMIN=IPN=i) + > EMIN=JPN=i) 
i=0 i=n 


Agora, suponha que saibamos que há um total de i caras nas primeiras n + m — 1 
tentativas. Se i < n, então já teremos obtido pelo menos m coroas. Com isso, o nú- 
mero de jogadas adicionais necessárias é igual ao número de n — i caras que ainda 
precisamos obter; similarmente, se i = n, então já teremos obtido pelo menos n ca- 
ras. Com isso, o número de jogadas adicionais necessárias é igual ao número de m 
-(n + m-1 —i) coroas que ainda precisamos obter. Consequentemente, temos 


n—1 4 
eumg= 5 (1 +m E RE —)PN=à 
i=0 p 
n+m-—1 E 
Tm 
+ 5 (nm ais 1 rw-a 
i=n l-p 


Cm trens 
=n+m-1+5 ( 


i=0 


Am dio 
+ a L+ “(" + ne ria - pet 


1 i ntm-l-i 
; > 1 — p) 
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O número esperado de jogadas necessárias para que obtenhamos n caras ou m 
coroas, Ejmín(X, Y)], é dado agora por 


Elmín(X, W] = EX + Y — M=º da 


CE 


EM] 


7.27 Este é justamente o tempo necessário para que recolhamos n — 1 dos n tipos de 
cupons no Exemplo 2i. Pelos resultados daquele exemplo, a solução é 


n 
+ +. + 


Rm n n 
n-1 n-—2 2 


728 Comg=1-p, 


n 


EXj=) PXx=)=5 Ppx=>9=) q1= 1 se 
i=] i=1 i=1 


7.29 
Cov(X,Y) = ELXY] -ELXMEIMY] = PM(X=1,Y=D-P(X=DPY=1) 
Portanto, 
Cov(X,YN)=0SP(X=,Y=D=PMX=DP(Y=1) 
Como 


Cov(X, Y) = Cov(1-X,1-Y) = —-Cov(1-X,Y) = —Cov(X,1-Y) 


o desenvolvimento anterior mostra que todas as igualdades a seguir são equiva- 
lentes quando X e Y são Bernoulli: 


1 Cov(X,Y)=0 
2. MX=1,Y=D=PMX=DP(Y=1) 
3. P1-X=1,1-Y=D=PG-X=DPA-Y=1) 
4 P1-X=1,Y=D)=PA-X=DP(Y=1) 
5. PMX=11-Y=D=PMX=DPA-Y=1) 
7.30 Numere os indivíduos e considere X,, = 1 se o j-ésimo indivíduo com tamanho de 


chapéu i escolher um chapéu com o seu tamanho, e X,, = 0 caso contrário. Então, 
o número de indivíduos que escolhem um chapéu de seu tamanho é 


Portanto, 


i= Di ettad=D 2-5 Oh m 


i=1 j=1 i=1 j=1 


CAPÍTULO 8 


8.1 Suponha que X represente o número de vendas feitas na próxima semana, e ob- 
serve que X é inteiro. Da desigualdade de Markov, obtemos: 


(a) PIX > 18) = P|X = 19) = no = 16/19 


EX] 
2» 


(DP(X > 25)=P(X > 26) = = 16/26 
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8.2 (a) 
PO =X=2)=P[X-—1i6=õ6 
=P(X — ul = 6) 
=1-P(IX-u|>6 
=1-9/36=3/4 


DPX=1W=PX-16=>]<-—=1p 


Na letra (a), usamos a desigualdade de Chebyshev; na letra (b), usamos sua 
versão unilateral (veja a Proposição 5.1). 


8.3 Observe primeiro que E[X —- Y] e 
Var(X — Y) = Var(X) + Var(Y) - 2Cov(X, Y) = 28 


Usando a desigualdade de Chebyshev na letra (b) e sua versão unilateral nas le- 
tras (b) e (c), obtemos os seguintes resultados: 
(a) PIX — Y| > 15) = 28/225 


28 
b per <-—— = 
(Pr > 15 sas = 28/2583 
28 


8.4 Se X é o número produzido na fábrica A e Y é o número produzido na fábrica B, 
então 


El — X]=-2, Var(Y — X)=36 +9=45 
45 
45 +9 


PY -X>0=PYy-X=20=PYy-X+223< = 45/54 


8.5 Note primeiro que 
1 
EXJ= ) 22 dx = 2/3 
0 
Use agora a lei forte dos grandes números para obter 


r= lim — 
n>500 S$,, 


n5oo Sy/n 
= 1 
TELS 
=1/0/3)=3/2 
8.6 Como E[X,| = 2/3 e 


1 
EL] - [ 2 dx = 1/2 
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temos Var(X,) = 1/2 — (2/3) = 1/18. Assim, se há n componentes disponíveis, então 
P(S, =35)=P(S, = 3455) (a correção da continuidade) 
o |º — 2/3 345 — | 


Jus É Val 


=pj2= SER) 


vn/18 
onde Z é uma variável aleatória normal padrão. Já que 
PIZ > -1,284) = P[Z < 1,284) = 0,90 

vemos que n deve ser escolhido de forma que 

(34,5 — 2n/3) = —1,284Vn/18 
Resolvendo numericamente, obtemos n = 55. 

8.7 Se X é o tempo necessário para a manutenção de uma máquina, então 
EX] =02+0,3=0,5 


Também, como a variância de uma variável aleatória exponencial é igual ao qua- 
drado de sua média, temos 


Var(X) E (0,2) + (0,3)? = 0,13 


Portanto, com X, sendo o tempo necessário para realizar um trabalho de manuten- 
ção i, i = 1,...,20,e Z sendo uma variável aleatória normal padrão, obtemos 


X + + Xo — 10 8 — 10 


P(X, + + Xoo < a=2| 


< 
2,6 V2,6 
= P(Z < —1,24035) 


= 0,1074 
8.8 Note primeiro que, se X é o ganho do jogador em uma única aposta, então 


ElX]=-07 - 04+1=-0,1,E[X?]=0,7 + 08 + 10=115 
>Var(X) = 11,49 


Portanto, com Z possuindo uma distribuição normal padrão, 


PM + +Xg<-0S=P < 
E fi I VTI49 TIO 


= P(Z < 0,2803) 
= 0,6104 


X +: + Xoo + 10 a —0,5 + e 


8.9 Usando a notação do Problema 8.7 temos 


PM ++ Xo < =P] 


t — 10 
= PiZ< 
| 56) 


Mt. + AX — 10 t-10 
2,6 2,6 
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Agora, P(Z < 1,645) = 0,95, então t deve ser tal que 
t — 10 
V2,6 


= 1,645 


o que resulta em 1 = 12,65. 


8.10 Se a alegação fosse verdadeira, então, pelo teorema do limite central, o conteúdo 
médio de nicotina (chame-o de X) teria aproximadamente uma distribuição nor- 
mal com média 2,2 e desvio padrão 0,03. Assim, a probabilidade de que ele seja de 
3,1 é 


=D Bi | 


P(X>3])=P/>[—— > >= 
0,03 0,03 
a P(Z > 5,196) 

x 0 


onde Z é uma variável aleatória normal padrão. 


8.11 (a) Se numerarmos as pilhas arbitrariamente e fizermos com que X, represente o 
tempo de vida da pilha i, i = 1,...,40, então os X)s são variáveis aleatórias in- 
dependentes e identicamente distribuídas. Para calcular a média e a variância 
do tempo de vida da pilha 1, condicionamos em seu tipo. Fazendo 1! = 1 se a 
bateria 1 for do tipo 4,e 1 = O se ela for do tipo B, temos 


E(X|l=1]=50,  ElX|=0]=30 
o que resulta em 
E[X,)] = 50P(1 = 1) + 30P[1 = 0) = 50(1/2) + 30(1/2) = 40 
Além disso, usando o fato de que E[W?) = (E[W])” + Var(W), temos 
ELI =1)=(502+(152=2725, EIX2I=0]=(302+6 =936 
o que resulta em 
E(X2] = (2725)(1/2) + (936)(1/2) = 1830,5 


Assim, X,,..., X, São variáveis aleatórias independentes e identicamente 
distribuídas com média 40 e variância 1830,5 — 1600 = 230,5. Portanto, com 
S= e Xi temos 


EIS] = 40(40) = 1600, Var(S) = 40(230,5) = 9220 
e o teorema do limite central resulta em 


S — 1600 1700 — e] 


> 

9220 9220 
= P(Z > 1,041) 

=1 — 9(1,041) = 0,149 


P(S > 1700) = P| 


(b) Suponha que S, seja o tempo de vida total de todas as pilhas do tipo A e que 
S, seja o tempo de vida total de todas as pilhas do tipo B. Então, pelo teorema 
do limite central, S, tem aproximadamente uma distribuição normal com mé- 
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dia 20(50) = 1000 e variância 20(225) = 4500,e S, tem aproximadamente uma 
distribuição normal com média 20(30) = 600 e variância 20(36) = 720. Como 
a soma de variáveis aleatórias normais independentes também é uma variável 
aleatória normal, vemos que S, + S, é aproximadamente normal com média 
1600 e variância 5220. Consequentemente, com $S = $, + Sg, 


S — 1600 1700 — 1600 
VD — 50 

= P(Z > 1,384] 

=1 — d(1,384) = 0,084 


P(S > 1700) = 


8.12 Suponha que N represente o número de médicos voluntários. Dado o evento N 
= i, o número de pacientes atendidos tem como distribuição a soma de i variá- 
veis aleatórias de Poisson independentes com média 30 (cada uma delas). Como a 
soma de variáveis aleatórias de Poisson também é uma variável aleatória de Pois- 
son, resulta que a distribuição condicional de X dado que N = i é uma distribuição 
de Poisson com média 30i. Portanto, 


E[XIN] = 30N Var(X|N) = 30N 


Como resultado, 
E[X] = E[E(XIN]] = 30E[N] = 90 
Também, pela fórmula da variância condicional, 
Var(X) = E[Var(XIN)] + Var(E[XIN]) = 30E[N] + (30) Var(N) 


Como 
Var(N) = e +32 +42) -9=2/3 


obtemos Var(X) = 690. 

Para obtermos uma aproximação para P[X > 65], não seria justificável supor 
que a distribuição de X seja aproximadamente aquela de uma variável aleatória 
normal com média 90 e variância 690. O que sabemos, no entanto, é que 

4 
P(X > 658)=5 PIX > 65IN = iJPIN 15? P;(65) 
i=2 


onde P;(65) é a probabilidade de que uma variável aleatória de Poisson com mé- 
dia 30: seja maior que 65. Isto é, 


65 
P6)=1 — 3 ego)! 
j=0 


Como uma variável aleatória de Poisson tem distribuição idêntica à da soma de 
30i variáveis aleatórias de Poisson independentes com média 1, resulta do teorema 
do limite central que sua distribuição é aproximadamente normal com média e 
variância iguais a 30i. Consequentemente, com X, sendo uma variável aleatória de 
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Poisson com média 30i, e Z sendo uma variável aleatória normal padrão, podemos 
aproximar P;(65) da seguinte maneira: 


PK65) = P(X > 65) 
=P(X = 65,5) 
X — 30: 65,5 — 30i 
=P > 
30i n30i 


<P |z - | 
30i 
Portanto, l 
P>(65) = P(Z = 0,7100) = 0,2389 
Ps(65) = P(Z = —2,583) = 0,9951 
Pa(65) = P(Z = -4975) = 1 
o que leva ao resultado 
P(X > 65] = 0,7447 


Se tivéssemos equivocadamente assumido X como sendo aproximadamente normal, 
teríamos obtido a resposta aproximada 0,8244 (a probabilidade exata é 0,7440). 


8.13 Calcule os logaritmos e então aplique a lei forte dos grandes números para obter 


1/n 
n 1 n 
log | || [x = — ) Jog(Xy= Ellog(A)] 
1=1 i=1 
Portanto, 
E: 1/n 
IH X; — eFllog(X)) 
i=1 
CAPÍTULO 9 


9.1 Do axioma (iii), resulta que o número de eventos que ocorrem entre os instantes 
8 e 10 tem a mesma distribuição que o número de eventos que ocorrem até o 
instante 2, e portanto é uma variável aleatória de Poisson com média 6. Com isso, 
obtemos as seguintes soluções para as letras (a) e (b): 


(a) PIN(10) - N(8) = 0) = €* 

(b) ELN(10) — N(8)] = 6 

(c) Resulta dos axiomas (ii) e (iii) que, a partir de um instante de tempo, a ocorrência 
dos eventos é uma variável aleatória de Poisson com média À. Com isso, o instan- 
te de ocorrência esperado para o quinto evento após 14:00 é 2 + E[S,] = 2 + 5/3. 
Isto é, o instante de ocorrência esperado é 15:40. 
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9.2 (a) 
P(N(1/3) =2IN(D =2) 
PNA/) =2,N(D) =2) 
E PIN() =2) 
“PNA/)=2,N() — N(1/3)=0) 
= PIN) =2) 
“ PNG/D=2PINOD) - N(/3)=0) 
= PIN(D) =2) 
- P(NG/3) =2)P(N(2/3) = 0) 
E PIN() =2) 
e AB (A/3)2/2e 2/3 
= edA2Z/2! 


(pelo axioma (ii)) 


(pelo axioma (iii)) 


== 1/9 


(b) 
PN(/2) = 1N(D) =2)=1 — P(N(/29 =0|N() =2) 


ao PINO/9 =0,N(1) =2) 


PING) =2) 
10 PNG/D=0,NO) — N(/2) =2) 
PING) =2) 
1 PNG/D=0PINO — N/D =2) 
P(N(1) =2) 

40 PING/D =0PNA/) =2) 

PING) =2) 
ERA eA/2e- AP (A /2)2/21 
E eAAZ/21 
=1-1/4=3/4 


9.3 Fixe um ponto na estrada e suponha X, = 0 se o n-ésimo veículo que passar for 
um carro e X, = 1 se for um caminhão, n = 1. Supomos agora que a sequência X,, 
n > 1, é uma cadeia de Markov com probabilidades de transição 


Pro = 5/6,Pg = 116,P, 0 = 45,P,, = 1/5 
Então a proporção de tempos a longo prazo é a solução de 
xo = 70(5/6) + m(4/5) 
71 = mo(1/6) + m(1/5) 
mo + m=1 
Resolvendo esse conjunto de equações, obtemos 
To = 24/29 m = 5/29 


Assim, 2400/29 = 83% dos veículos na estrada são carros. 
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9.4 As sucessivas classificações de tempo constituem uma cadeia de Markov. Se os 
estados são O para chuvoso, 1 para ensolarado e 2 para encoberto, então a matriz 
de probabilidades de transição é: 


O 1/2 1/2 
P= 1/3 1/3 1/3 
1/3 1/3 1/3 
As proporções de longo prazo satisfazem 
xo = m1(1/3) + mo(1/3) 
m = mo(1/2) + m(1/3) + mo(1/3) 
n2 = n0(1/2) + m(1/3) + m2(1/3) 
l=m+m+7m 


A solução desse sistema de equações é 


To = 1/4,7, = 3/8, 7, = 3/8 


Portanto, três oitavos dos dias são ensolarados e um quarto é chuvoso. 
9.5 (a) Um cálculo direto dá 
H(X) H(Y) = 1,06 


(b) Ambas as variáveis aleatórias assumem dois de seus valores com mesmas 
probabilidades 0,35 e 0,05. A diferença é que, se elas não assumirem nenhum 
desses valores, então X, mas não Y, tem a mesma probabilidade de assumir 
qualquer um de seus três valores restantes. Com isso, do Exercício Teórico 
9.13, esperaríamos o resultado da letra (a). 


CAPÍTULO 10 


10.1 (a) 
1 
1=c[ edx>C=1/(e- 1) 
0 
(b) 
x ae 
Fy=c[ AEE a 0=rx=l 
0 e-—1 
Portanto, se fizermos X = F (U), então 
et 1 
“e-1 


ou 
X =log(U(e —- D+ 1) 


Logo, podemos simular a variável aleatória X gerando um número aleatório U 
e fazendo X = log(U(e — 1) + 1). 
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10.2 Use o método de aceitação-rejeição com g(x) = 1,0 < x < 1. O emprego da teo- 
ria do cálculo mostra que o valor máximo de f(x)/g(x) ocorre em um valor de x, 
O<x<1,tal que 


2x-60 + 4x! = 0) 


ou, equivalentemente, quando 


4 -6x+2=(4x-2x-1)=0 


O máximo ocorre, portanto, quando x = 1/2. Daí resulta que 


C= máx flo)/g(x) = 30(1/4- 2/8 + 1/16) = 15/8 


Com isso, o algoritmo é o seguinte: 


Passo 1. 
Passo 2. 


Gere um número aleatório U,. 
Gere um número aleatório U,. 


Passo3. SeU,= 16(U? — 2U? + Ut), faça X = U,; do contrário, retorne para 


o Passo 2. 


10.3 É mais eficiente verificar primeiro os valores com maiores probabilidades, como 
no algoritmo a seguir: 


Passo 1. 
Passo 2. 
Passo 3. 
Passo 4. 
Passo 5. 


10.42u — X 


Gere um número aleatório U. 
Se Ux=õ0,35,faça X =3e pare. 
Se U = 0,65,faça X = 4e pare. 
Se U = 0,85,faça X =2e€ pare. 
X=1. 


10.5 (a) Gere 2n variáveis aleatórias exponenciais com média 1, X, Y,i=1,...,n,e 
hn 


depois use o estimador >) Xi /n. 


i=l 


(b) Podemos usar XY como variável de controle para obter um estimador do 


tipo 


Si + eXyon 


i=1 


Outra possibilidade seria usar XY + XºY?/2 como variável de controle e assim 
obter um estimador do tipo 


n 
De + XY; + X7Y2/2 — 1/2D/n 
i=1 


A motivação para a última fórmula se baseia no fato de que os primeiros três 
termos da expansão de e” em uma série de MacLaurin são 1 + xy + (xºy?)/2. 
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